Был проведён поиск гомологов с помощью программы BLAST. Для большинства параметров поиска были оставлены значения по умолчанию: так как проводилось выранивание белковых последовательностей, был использован алгоритм blastp; установлен размер выдачи в 100 находок; порог на E-value составил 0,05; длина слова равна 2; использована матрица BLOSUM62; штраф за открытие инделя равнялся 11, а за удлинение инделя — 1; были включены фильтры на участки малой сложности. Была изменена база данных, по которой осуществлялся поиск, на Swiss-Prot (требование по заданию).
Всего было обнаружено 10 находок, включая исходную последовательность. Были отобраны 5: 4 - с наибольшой процентной идентичностью и 1 - случайно из оставшихся. Проведено множественное выранивание.
Думаю, что все белки являются гомологичными, так как имеют большое количество схожих участков.
ID:POL_MLVBM;
AC:Q7SVK7;
OS:Murine leukemia virus (strain BM5 eco)
[534:658]
note="Protease"
id="PRO_0000442912"
17 находок. Выбираем 6, включая зрелый белок.
Также считаю, что все белки являются гомологичными, так как имеют большое количество схожих участков.
Число находок увеличилось на 6 (было 17 - стало 23).
Возьмем белок с АС:P03360.2 (с максимальным значением E-value,o чтобы погрешность была минимальная). Значение E-value до фильтра 1е-12, а после 4е-14. То есть оно увеличилось. А следовательно, доля вирусных белков в Swissprot равна 4%.