Белок из восьмого практикума - Pertussis toxin subunit A (ptxA). Запуск BLAST производился со следующими параметрами:
AC: AAA83980.1
Database: UniProtKB/Swiss-Prot
Max target sequences: 100
Word size: 6
Остальные параметры стандартны.
Программа выдала 4 находки, меняя Word Size от 2 до 6, количество не изменилось.
Помимо исходного белка, были выбраны последовательности из Bordetella bronchiseptica, Bordetella parapertussis, Mycoplasma pneumoniae.
Выравнивание было создано в Jalview.
Была удалена одна последовательность из Mycoplasma pneumoniae, очень много вставок, которые при выравнивании образуют гэпы в других последовательностях. Остальные последовательности гомологичны, несовпадения единичны. Этот белок крайне консервативен. Все последовательности взяты из организмов рода Bordetella, наверное, их механизмы инфицирования клеток очень схожи.
Результаты выравнивания в файле.
По запросу
taxonomy:"Viruses [10239]" name:polyprotein
был выбран полипротеин, его данные:
ID: POL_VILV;
AC: P03370;
OS: Maedi visna virus (strain 1514) (MVV) (Visna lentivirus).
Из этого полипротеина была выбрана цепь белка Reverse transcriptase/ribonuclease H, координаты: 541-1111.
Его последовательность находится в файле.
При запуске BLAST была введена последовательность белка, база данных - UniProtKB/SwissProt, word size - 3, max target sequences - 500, остальные параметры стандартны, фильтр на таксон не ставился.
Текстовая выдача программы
Программа выдала 209 находок. Были выбраны 6 последовательностей помимо исходного белка.
Видимо, у части белков отсутствует участок на N-конце. Я оставила все последовательности, так как они все в какой-то степени сходны с исходным белком, есть много консервативных участков.
Результаты выравнивания в файле.
С применением фильтра на таксон из 209 осталось 136 находок. Белок рибонуклеаза H встречается также у бактерий и эукариот.
E-value у некоторых находок изменился: например, у Q1A249.3 E-Value изменился с 8e-105 до 3e-106, то есть уменьшился примерно в 27 раз. Значит, раза данных тоже (линейная зависимость). Доля вирусных белков в Swiss-Prot равна 3.7%.