Поиск по базе Swiss-Prot
-Алгоритм blastp
-Всего 100 последовательностей
-Автоматическое сокращение выдачи
-Пороговое значени E-value 0,05
- Длина слова - 6
- Фильтр включен
- Организм любой
Ссылка на выравнивание
Я решил оставить все белки. Несмотря на то, что до 80 позиции в выравнивании консерватинвых участков сравнительно немного (есть, например, на 10-12, 60-65), в дальнейшем выделены уже крупные и более частые консервативные области. Например, 80-84, 90-95, 112-117, 144-147, 188-201, 235-239, 254-262. При этом первые две последовательности почти идентичны.
ID: POLG_JAEVM
AC: G3FEX6; A0A165GB83
Вирус: Japanese encephalitis virus (strain M28) (JEV)
Полипротеин: Serine protease NS3 [1505-2123]
В полученном выравнивании я удалил только один белок. Все отсальные я решил не удалять из-за высокой концентрации консервативных участков
Ссылка на выравнивание
При добавлении ограничения на поиск по вирусам в выдаче изменились значения E-value у тех же результатов. Так, например, в первой выдаче все значения E-value были равны нулю вплоть до последовательности с 4e-165, а у той же последовательности при добавлении ограничения уже 2e-166. Соответсвенно, значение уменьшилось, указывая на то, что случайность данной находки стала еще меньше. Но, нужно понимать, конечно, что это связано с уменьшением размера базы, по которой осуществлялся поиск. Чтобы оценить долю вирусных белков, нужно оценить изменение E-value. Оно уменьшилось в 20 раз. Из линейной зависимости E-value от размера базы данных можно сказать, что доля вирусных белков в Swiss-Prot равна где-то 5%.