Выравнивание белков с использованием Protein BLAST

1. Поиск гомологов белка NUOK_METGS
Параметры выравнивания использовались по умолчанию, кроме Database: Swiss-prot и Max target sequences: 250. Ссылка на текстовую выдачу.
Все белки высоко идентичны, единичные различия последовательностей, поэтому можно предположить, что они гомологичны. Ссылка на выравнивание.
2. Поиск гомологов зрелого вирусного белка, вырезанного из полипротеина
Полипротеин принадлежит New York virus (NYV), его ID: GP_NYV, его AC: Q83887.
Один из зрелых белков, на которые разрезается полипротеин: Glycoprotein N с 18 по 652 аминокислоты. Cсылка на скачивание последовательности белка.
Параметры выравнивания использовались по умолчанию, кроме Database: Swiss-prot и Max target sequences: 250. Ссылка на текстовую выдачу.
Белки высоко идентичны, мало аминокислот выпадают. Можно сделать вывод, что белки гомологичны. Ссылка на выравнивание.
3. Исследование зависимости E-value от объёма банка
Если делать повторный поиск с ограничением по таксону, то есть только среди Viruses, то количество белков остается равных 18, а e-value у всех равно 0.0.
Поэтому выбрала другой белок вируса: Outer capsid protein VP4 из Rotavirus A (ID: VP4_ROTSH). Если искать без указания таксона (Рис.1), то выдается 63 белка, если с указанием Viruses (Рис.2) - 62. Большая часть имеет в e-value машинный ноль, но последние 3 или 4 можно использовать для поиска доли вирусных белков.
Рис.1. Вырезка из выдачи BLAST при поиске без указания таксона, где e-value не равен 0.0
Рис.2. Вырезка из выдачи BLAST при поиске с указанием Viruses, где e-value не равен 0.0
Будем считать для белка из Porcine rotavirus C strain Cowden: без применения фильтра “Organism: Viruses”: 4*10-112, с его применением: 1*10-110. Получается соотношение 1/25.
В Swissprot вирусных белков в 25 раз меньше, таким образом их доля - 0,04.
Если считать для белка из Human rotavirus C/Bristol: без применения фильтра “Organism: Viruses”: 3*10-105, с его применением: 6*10-104. Получается соотношение 1/20.
В Swissprot вирусных белков в 20 раз меньше, таким образом их доля - 0,05.
Если считать для белка из Human rotavirus C/Bristol: без применения фильтра “Organism: Viruses”: 2*10-103, с его применением: 5*10-102. Получается соотношение 1/25.
В Swissprot вирусных белков в 25 раз меньше, таким образом их доля - 0,04.