Изображение выравниваний

Выравнивание последовательностей — определение взаимного соответствия остатков в двух или нескольких последовательностях, при котором сохраняется исходный порядок остатков в последовательностях. Степень подобия двух последовательностей может помочь сделать заключение об их гомологичности.

1

Были даны идентефикаторы UniProt шести белков. При помощи программы JalView было построено их множественное выравнивание (см. рис. 1).

Рис. 1. Множественное выравнивание шести предложенных белков

Примечание. Белок A8P9B2_BRUMA, который был предложен в таблице (третий по порядку), удалён из UniProt. На сайте нет чётких указаний на то, как называется новая версия этого белка, поэтому был использован инструмент Standard Protein BLAST NCBI. Был найден белок со 100% совпадением аминокислотной последовательности (UniProt), однако найденная последовательность на 38 аминокислотных остатков короче, чем сохранённая в архиве версия предыдущей (их выравнивание).

В последней сохранившейся записи A8P9B2_BRUMA ссылаются на протеом UP000026912, в аннотации белка A0A0K0JDT2 ссылаются на два протеома: UP000006672, UP000026912. При поиске белка Bm4240 по протеому, на который ссылаются оба белка (команда поиска «bm4240 proteome:up000026912»), была найдена ссылка только на A0A0K0JDT2. В итоге было принято решение использовать именно эту последовательность при выравнивании. Из сохранившейся аннотации A8P9B2_BRUMA можно сделать вывод, что предполагалось существование двух изоформ белка bm4240, однако в итоге, видимо, это было опровергнуто.

2

Для того, чтобы найти белок, который не гомологичен остальным, опираясь только на аминокислотные последовательности, было создано 6 новых выравниваний, в каждом их которых отсутствовала одна из последовательностей. Было установлено, что чисто консервативных (функционально и полностью) остатков резко увеличивается при удалении шестой последовательности, это белок с идентефикатором H0Q0A1_9RHOO. Выравнивание без этой последовательности представлено на рис. 2.

Рис. 2. Множественное выравнивание без белка H0Q0A1_9RHOO (были удалены N- и C-концевые участки с избытком гэпов)

Также можно посмотреть на это выравнивание в текстовом виде (.fasta, .msf) или загрузить его JalView-проект.

Вывод

Из проделанной работы следует, что белок с идентефикатором H0Q0A1_9RHOO не гомологичен группе белков с идентефикаторами N6X0D6_9RHOO, G3I0A8_CRIGR, A8P9B2_BRUMA, F8F3U9_TRECH и I2G493_USTH4 (внутри же этой группы белков степень подобия достаточно высока, что позволяет нам сказать, что они с высокой долей вероятности гомологичны).

© Исаев Сергей,