Для поиска гомологов использовалась программа BLAST. Были установлены следующие параметры:
Всего было 34 находки, включая исходный белок. Гиперссылка на результат поиска
. Были отобраны следующие: P40881.1 (исходная), Q8DKB5.1, Q8YYI3.1, O30711.1, Q03513.1, P72758.1, P40882.2На выравнивании можно заметить, что схожесть отобранных белков между собой выше, чем с исходным белком. Они, вероятно, гомологичны друг другу, и с меньшей вероятностью гомологичны исходному белку
Для работы был выбран полипротеин вируса сонной болезни (ID POLN_SLDV, AC Q8QL53). Дальнейшая работа производилась с кэпирующим ферментом (1-516 остаток) (ссылка на fasta). Для построения выравнивания были отобраны следующие белки: Q8QL53.1 - изначальный белок, Q8JJX1.1, Q9JGL0.3, P87515.3, Q5Y389.3, Q8QZ73.3. Последний белок при выравнивании показал мало сходства и был удалён.
При поиске только по таксону вирусов было получено столько же результатов, сколько при поиске среди всех организмов. Значит, за пределами группы вирусов у белка не нашлось гомологов.
Сравним E-value для одного и того же белка в двух поисках. Я выбрала для этого Q8JUX6.1. В случае поиска без фильтра его значение составило 4e-135, с фильтром - 2e-136. Значение уменьшилось в 20 раз, значит, вирусные белки составляют 1/20 (или 5%) от всех белков базы.