Практикум 10

Задание 1

Был проведён поиск гомологов с помощью программы BLAST. Для большинства параметров поиска были оставлены значения по умолчанию: так как проводилось выранивание белковых последовательностей, был использован алгоритм blastp; установлен размер выдачи в 100 находок; порог на E-value составил 0,05; длина слова равна 2; использована матрица BLOSUM62; штраф за открытие инделя равнялся 11, а за удлинение инделя — 1; были включены фильтры на участки малой сложности. Была изменена база данных, по которой осуществлялся поиск, на Swiss-Prot (требование по заданию).

Всего было обнаружено 10 находок, включая исходную последовательность. Были отобраны 5: 4 - с наибольшой процентной идентичностью и 1 - случайно из оставшихся. Проведено множественное выранивание.

Выдача BLAST.

Ссылка на выравнивание.

Думаю, что все белки являются гомологичными, так как имеют большое количество схожих участков.

Задание 2

ID:POL_MLVBM;

AC:Q7SVK7;

OS:Murine leukemia virus (strain BM5 eco)

[534:658]

note="Protease"

id="PRO_0000442912"

Выдача BLAST.

Зрелый белок вируса.

17 находок. Выбираем 6, включая зрелый белок.

Ссылка на выравнивание.

Также считаю, что все белки являются гомологичными, так как имеют большое количество схожих участков.

Задание 3

Число находок увеличилось на 6 (было 17 - стало 23).

Возьмем белок с АС:P03360.2 (с максимальным значением E-value,o чтобы погрешность была минимальная). Значение E-value до фильтра 1е-12, а после 4е-14. То есть оно увеличилось. А следовательно, доля вирусных белков в Swissprot равна 4%.