Настройки поиска

Поиск по базе Swiss-Prot

-Алгоритм blastp

-Всего 100 последовательностей

-Автоматическое сокращение выдачи

-Пороговое значени E-value 0,05

- Длина слова - 6

- Фильтр включен

- Организм любой

Выдача

Выравнивание

Ссылка на выравнивание

Я решил оставить все белки. Несмотря на то, что до 80 позиции в выравнивании консерватинвых участков сравнительно немного (есть, например, на 10-12, 60-65), в дальнейшем выделены уже крупные и более частые консервативные области. Например, 80-84, 90-95, 112-117, 144-147, 188-201, 235-239, 254-262. При этом первые две последовательности почти идентичны.

Полипротеин

ID: POLG_JAEVM

AC: G3FEX6; A0A165GB83

Вирус: Japanese encephalitis virus (strain M28) (JEV)

Полипротеин: Serine protease NS3 [1505-2123]

В полученном выравнивании я удалил только один белок. Все отсальные я решил не удалять из-за высокой концентрации консервативных участков

Ссылка на выравнивание

E-value

При добавлении ограничения на поиск по вирусам в выдаче изменились значения E-value у тех же результатов. Так, например, в первой выдаче все значения E-value были равны нулю вплоть до последовательности с 4e-165, а у той же последовательности при добавлении ограничения уже 2e-166. Соответсвенно, значение уменьшилось, указывая на то, что случайность данной находки стала еще меньше. Но, нужно понимать, конечно, что это связано с уменьшением размера базы, по которой осуществлялся поиск. Чтобы оценить долю вирусных белков, нужно оценить изменение E-value. Оно уменьшилось в 20 раз. Из линейной зависимости E-value от размера базы данных можно сказать, что доля вирусных белков в Swiss-Prot равна где-то 5%.