Параметры запуска BLAST: word size-3; expect threshold- 0.05; матрица весов замен- Blosum 62; штрафы за открытие и продолжение инделей- 11 и 1, соответственно; отфильтровывание выравниваний с участками малой сложности включено.
Ссылка на текстовую выдачу программы.
Я предполагаю, что все белки гомологичны, так как в выравнивании можно увидеть большое количество консервативных колонок.
Взяла вирус: ID POLN_GETV, AC Q5Y389, OS Getah virus (GETV)
Взяла срез [535:1332], note="Protease nsP2", id="PRO_0000228776".
Находок 65, выбрать необходимо 6, включая вводимую последовательость.
Ссылка на вырезанный фрагмент.
Ссылка на выравнивание до удаления.
Я предпологаю, что не все белки являются гомологичными, так как количество гепов было слишком велико, поэтому последовательность белка 5 я убрала.
Ссылка на выравнивание после удаления.
Ссылка на текстовую выдачу программы.
При добавлении к предыдущему поиску BLAST фильтра по организмам (Viruses), количество находок увеличилось на 7 (с 65 до 72).. Также для находок изменилось значение E-Value, например для организма с AC:A0A0S2T050.1 значение изменилось с 2е-05 до 7е-07. Так как значение E-value прямопропорционально размеру базы данных, в которой идет поиск (так как при поиске ничего кроме значения E-value и объема базы данных не менялось), то процент вирусных белков в базе данных Swiss-Prot примерно равен 3,63%.