Для выравнивания в программе BLAST алгоритмом blastp в поле Enter Query Sequence я ввел AC белка из pr7 (L8EUQ6). В качестве базы данных для поиска использовалась Swiss-Prot. Остальные параметры, в том числе и Algoritm parameters остались без изменений, за исключением максимального числа выдаваемых находок, его я увеличил до 5000:
Далее, из выдачи BLAST было выбрано 5 белков и получено их выравнивение вместе с исследуемым белком (всего 6 последовательностей). Результаты выравнивания показывают, что последовательности скорее являются гомологичными. В тоже время в вырвнивании присутствуют несколько длинных негомологичых участков, что может быть связано с тем, что исследуемый белок - единственный имеет двойную функцию.
В качестве исследуемого белка я выбрал белок шипа (пепломера) VP25 (424..648) полипротеина CAPSD_HASV8 (Q9IFX1) человеческого астровируса (Human astrovirus-8). Указанный участок был вырезан программой seqret и выравне (аналогично п.1).
По результатам множественного выравнивания можно сказать, что все белки гомологичны: этому свидетельствует значительное количество консервативных колонок в выравнивани (вот наиболее длинные: 94-99; 134-136; 167-169)
При повторении выравнивания из п.2 с применением фильтра по организмам (Viruses) количество находок не изменилось. Изначально E-value CAPSD_HASV1 (O12792 ) равнялось 3e-83, а после применения фильтра стало 1e-84. Так как единственный изменяемый параметр был фильтр по организмам, то отношение E-value после и до фильтра будет равнятся отношению количества последовательностей вирусов в датабазе и самой датабазы, т. е. всего доля вирусных белков будет равна 1/30 (примерно 33,33%)