Работа с Blast
Задание 1
1.Параметры запуска BLAST: word size-3; expect threshold- 0.05; матрица весов замен- Blosum 62; штрафы за открытие и продолжение инделей- 11 и 1, соответственно; отфильтровывание выравниваний с участками малой сложности включено. Текстовая выдача программы
2.Ссылка на выравнивание. Белки достаточно длинные, поэтому ,к сожалению , разместить картинку на сайте не представляется возможным(. Белки, скорее всего, гомологичны, т.к. у них высокий процент идентичности (>60%), в выравнивании можно увидеть множество совпадающих колонок (т.е. консервативных).
Задание 2
Выбрал Polyprotein P1234 (AC:Q9WJC7,ID:POLN_EEVVM, Venezuelan equine encephalitis virus), затем взял его срез ([536:1329], "Protease nsP2"); Ссылка на сегмент.
Файлы, аналогичные первому заданию: 1.Выдача Blast, 2.Множественное выравнивание
Задание 3
E- value запросов было минимальным (настолько малым, что в соответствующей колонке у заметной части выравниваний стоит 0),но все же степень изменения E- value можно проследить по нескольким находкам: отношение значения при втором запросе к значению в первом колеблется от 0.05 до 0.033 (среднее- 0.041).
Из этого можно сделать следующий вывод: (суммарная длина всех вирусных белковых последовательностей)/(суммарная длина всех белковых последовательностей)= 0.041 (примерно), т.к. единственное отличие двух запросов- указание таксона в одном из них, из-за чего уменьшилось значениние n в формуле, позволяющей оценить E-value(Теорема Карлина). Получается, доля вирусных белков в SwissProt приблизительно равна 0.041 (4.1%).
Сравнение проделано по следующим выдачам Blast: выдача без указания таксона ; выдача с указанием таксона.