Учебный сайт Сергея Маргасюка

Построение парных выравниваний. Поиск по сходству

Найдем с помощью сервиса BLAST последовательности из геномов бактерий, гомологичные WP_012611422.1, в базе данных RefSeq (условия поиска BLAST, взятые с сайта NCBI, находятся в файле pr11-query.asn). Было найдено 3272 предполагаемых гомолога (то есть последовательностей, для которых E-value < 0.001). Среди них есть те, для которых покрытие полученным локальным выравниванием последовательности-запроса превышает 80% : таких результатов 28. Далее приведено описание некоторых результатов из выдачи BLAST: лучшего по E-value (WP_007521493.1), худшего (WP_053550070.1) и произвольного из середины списка (WP_057104610.1):

Таблица 1: Описание нескольких гомологов белка WP_012611422.1
WP_007521493.1 WP_057104610.1 WP_053550070.1
Длина выравнивания 317 289 64
bit score 655 221 37.4
% идентичных а.о. 99 42 34
% сходных а.о. 99 59 50
E-value 0.0 1e-67 9.3

Далее приведены выравнивания для этих белков с исходным, полученные в BLAST:

Среди результатов поиска есть те, которые можно считать гомологами целой исходной последовательности (E-value < 0.001, Query cover ≥ 70%): таких последовательностей 77.

Было построено множественное выравнивание выборки из 20 гомологов исходного белка; в полученном выравнивании мало блоков (возможно, из-за жестких условий на количество абсолютно консервативных последовательностей), участки на концах выравнивания сильно различаются у разных последовательностей.

При сравнении выравниваний исходного белка и одного из гомологов, полученных из MUSCLE, BLAST, needle и water можно отметить, что все полученные выравнивания попарно различны; приведем пример участка, на котором выравнивания различаются:

LILDT--L
LLETAG-I
LILDT--L
L-LETAGI
LILDT--L
L-LETAGI
LILDT--L
LLETAG-I
		

Приведенный участок — отрезок [85;92] из полученной совокупности выравниваний (одно под другим расположены последовательно выравнивания, полученные в MUSCLE, water, needle и blast)

Кроме данного сравнения, было проведено сравнение выравниваний двух негомологичных белков: WP_012611422.1 и WP_010971478.1, полученных в программах needle и water. Полученные выравнивания оказались идентичными (то есть локальное выравнивание water целиком входило в глобальное выравнивание needle).

Ссылка на файл с проектом JalView: pr11.jvp


© Сергей Маргасюк, 2015