Практикум №10

Задание 1

Параметры запуска BLAST: word size-3; expect threshold- 0.05; матрица весов замен- Blosum 62; штрафы за открытие и продолжение инделей- 11 и 1, соответственно; отфильтровывание выравниваний с участками малой сложности включено.

Ссылка на текстовую выдачу программы.

Ссылка на выравнивание.

Я предполагаю, что все белки гомологичны, так как в выравнивании можно увидеть большое количество консервативных колонок.

Задание 2

Взяла вирус: ID POLN_GETV, AC Q5Y389, OS Getah virus (GETV)

Взяла срез [535:1332], note="Protease nsP2", id="PRO_0000228776".

Находок 65, выбрать необходимо 6, включая вводимую последовательость.

Ссылка на вырезанный фрагмент.

Ссылка на выравнивание до удаления.

Я предпологаю, что не все белки являются гомологичными, так как количество гепов было слишком велико, поэтому последовательность белка 5 я убрала.

Ссылка на выравнивание после удаления.

Ссылка на текстовую выдачу программы.

Задание 3

При добавлении к предыдущему поиску BLAST фильтра по организмам (Viruses), количество находок увеличилось на 7 (с 65 до 72).. Также для находок изменилось значение E-Value, например для организма с AC:A0A0S2T050.1 значение изменилось с 2е-05 до 7е-07. Так как значение E-value прямопропорционально размеру базы данных, в которой идет поиск (так как при поиске ничего кроме значения E-value и объема базы данных не менялось), то процент вирусных белков в базе данных Swiss-Prot примерно равен 3,63%.

Ссылка на текстовую выдачу программы.