BLAST


1. Гомологи ptxA

Белок из восьмого практикума - Pertussis toxin subunit A (ptxA). Запуск BLAST производился со следующими параметрами:

AC: AAA83980.1
Database: UniProtKB/Swiss-Prot
Max target sequences: 100
Word size: 6
Остальные параметры стандартны.

Программа выдала 4 находки, меняя Word Size от 2 до 6, количество не изменилось.

Текстовая выдача программы

Помимо исходного белка, были выбраны последовательности из Bordetella bronchiseptica, Bordetella parapertussis, Mycoplasma pneumoniae.

Выравнивание было создано в Jalview.
Была удалена одна последовательность из Mycoplasma pneumoniae, очень много вставок, которые при выравнивании образуют гэпы в других последовательностях. Остальные последовательности гомологичны, несовпадения единичны. Этот белок крайне консервативен. Все последовательности взяты из организмов рода Bordetella, наверное, их механизмы инфицирования клеток очень схожи.

Результаты выравнивания в файле.


2. Гомологи белка из полипротеина вируса Maedi visna virus

По запросу

taxonomy:"Viruses [10239]" name:polyprotein

был выбран полипротеин, его данные:

ID: POL_VILV;
AC: P03370;
OS: Maedi visna virus (strain 1514) (MVV) (Visna lentivirus).

Из этого полипротеина была выбрана цепь белка Reverse transcriptase/ribonuclease H, координаты: 541-1111.
Его последовательность находится в файле.

При запуске BLAST была введена последовательность белка, база данных - UniProtKB/SwissProt, word size - 3, max target sequences - 500, остальные параметры стандартны, фильтр на таксон не ставился.

Текстовая выдача программы

Программа выдала 209 находок. Были выбраны 6 последовательностей помимо исходного белка.

Видимо, у части белков отсутствует участок на N-конце. Я оставила все последовательности, так как они все в какой-то степени сходны с исходным белком, есть много консервативных участков.
Результаты выравнивания в файле.


3. Исследование зависимости E-value от объёма банка

С применением фильтра на таксон из 209 осталось 136 находок. Белок рибонуклеаза H встречается также у бактерий и эукариот.
E-value у некоторых находок изменился: например, у Q1A249.3 E-Value изменился с 8e-105 до 3e-106, то есть уменьшился примерно в 27 раз. Значит, раза данных тоже (линейная зависимость). Доля вирусных белков в Swiss-Prot равна 3.7%.