Работа с Blast

Задание 1

1.Параметры запуска BLAST: word size-3; expect threshold- 0.05; матрица весов замен- Blosum 62; штрафы за открытие и продолжение инделей- 11 и 1, соответственно; отфильтровывание выравниваний с участками малой сложности включено. Текстовая выдача программы

2.Ссылка на выравнивание. Белки достаточно длинные, поэтому ,к сожалению , разместить картинку на сайте не представляется возможным(. Белки, скорее всего, гомологичны, т.к. у них высокий процент идентичности (>60%), в выравнивании можно увидеть множество совпадающих колонок (т.е. консервативных).

Задание 2

Выбрал Polyprotein P1234 (AC:Q9WJC7,ID:POLN_EEVVM, Venezuelan equine encephalitis virus), затем взял его срез ([536:1329], "Protease nsP2"); Ссылка на сегмент.

Файлы, аналогичные первому заданию: 1.Выдача Blast, 2.Множественное выравнивание

Задание 3

E- value запросов было минимальным (настолько малым, что в соответствующей колонке у заметной части выравниваний стоит 0),но все же степень изменения E- value можно проследить по нескольким находкам: отношение значения при втором запросе к значению в первом колеблется от 0.05 до 0.033 (среднее- 0.041).

Из этого можно сделать следующий вывод: (суммарная длина всех вирусных белковых последовательностей)/(суммарная длина всех белковых последовательностей)= 0.041 (примерно), т.к. единственное отличие двух запросов- указание таксона в одном из них, из-за чего уменьшилось значениние n в формуле, позволяющей оценить E-value(Теорема Карлина). Получается, доля вирусных белков в SwissProt приблизительно равна 0.041 (4.1%).

Сравнение проделано по следующим выдачам Blast: выдача без указания таксона ; выдача с указанием таксона.