Для белка с идентификатором AC Swiss-Prot Q5JHF1 (Пантоаткиназа) запустил программу BLAST для поиска гомологичных белков.
Параметры BLAST, которые были использованы:
Всех находок у меня оказалось всего три, я менял параметр "Word size" на 3, а потом на 2, но находок оставалось столько же.
Далее сделал множественное выравнивание.
Ссылка на проект JalviewЯ считаю, что все выровненные белки гомологичны, т.к. у них есть много участков большого сходства.
Я выбрал полипротеин с ID POLN_ABPVR и AC Q9DSN9 организма Acute bee paralysis virus (strain Rothamsted) (ABPV).
Далее я выбрал белок SF3 helicase, с координатами 1126-1343.
Ссылка на последовательность белка в формате fastaПосле этого я сделал то же самое, что и в задании 1 (BLAST, отобрал 5 наилучших находок, множественное выравнивание).
Ссылка на текстовую выдачу программы Ссылка на проект JalviewПосле повторного поиска с указанием viruses (taxid:10239) было найдено, на удивление, больше белков находок: 7 вместо 6.
Можно расчитать примерную долю вирусных белков с помощью формулы
Для находки с кодом доступа POLG_AEVCA значение E-value поменялось с 0.033 на 0.001, вес выравнивания и длина исходной последовательности не изменились и получается, что доля вирусных белков в Swiss-Prot примерно составляет 3%.