Параметры выравнивания использовались по умолчанию, кроме Database: Swiss-prot и Max target sequences: 250. Ссылка на текстовую выдачу.
Белки высоко идентичны, мало аминокислот выпадают. Можно сделать вывод, что белки гомологичны.
Ссылка на выравнивание.
3. Исследование зависимости E-value от объёма банка
Если делать повторный поиск с ограничением по таксону, то есть только среди Viruses,
то количество белков остается равных 18, а e-value у всех равно 0.0.
Поэтому выбрала другой белок вируса: Outer capsid protein VP4 из Rotavirus A (ID: VP4_ROTSH).
Если искать без указания таксона (Рис.1), то выдается 63 белка, если с указанием Viruses (Рис.2) - 62.
Большая часть имеет в e-value машинный ноль, но последние 3 или 4 можно использовать для поиска доли вирусных белков.
Будем считать для белка из Porcine rotavirus C strain Cowden: без применения фильтра “Organism: Viruses”: 4*10-112,
с его применением: 1*10-110. Получается соотношение 1/25.
В Swissprot вирусных белков в 25 раз меньше, таким образом их доля - 0,04.
Если считать для белка из Human rotavirus C/Bristol: без применения фильтра “Organism: Viruses”: 3*10-105,
с его применением: 6*10-104. Получается соотношение 1/20.
В Swissprot вирусных белков в 20 раз меньше, таким образом их доля - 0,05.
Если считать для белка из Human rotavirus C/Bristol: без применения фильтра “Organism: Viruses”: 2*10-103,
с его применением: 5*10-102. Получается соотношение 1/25.
В Swissprot вирусных белков в 25 раз меньше, таким образом их доля - 0,04.