Выравнивание последовательностей

Петренко Павел

Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова

Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
D-aminoacyl-tRNA deacylase DTD_ECOLI DTD_BACSU 303.0 40.4% 58.2% 10.3% 2
Dihydrofolate synthase/folylpolyglutamate synthase FOLC_ECOLI FOLC_BACSU 421.0 28.1% 44.2% 15.6% 16
Adenylate kinase KAD_ECOLI KAD_BACSU 527.5 46.4% 65.8% 5.9% 3

Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
D-aminoacyl-tRNA deacylase DTD_ECOLI DTD_BACSU 306.0 46.8% 66.7% 0.0% 0 69,7% 76,5%
Dihydrofolate synthase/folylpolyglutamate synthase FOLC_ECOLI FOLC_BACSU 430.0 29.6% 46.1% 13.8% 14 93,8% 92,1%
Adenylate kinase KAD_ECOLI KAD_BACSU 527.5 47.2% 67.0% 4.1% 2 98,1% 95,9%

Комментарии к выравниваниям

При сравнении глобального и локального выравнивания видно, что локальное выравнивание является более точным. Это можно сказать благодаря сравнению веса выравниваний, процента идентичности и схожести.

Последовательности с мнемониками DTD и KAD мы можем назвать гомологичными, так как процент их идентичности достаточно высокий (40.4%/46.4% в глобальном выравнивании и 46.8%/47.2% в локальном выравнивании соответственно). Последовательности с мнемоникой FOLC также можно назвать гомологичными, так как их процент идентичности выше 25% (28.1%/29.6% в глобальном/локальном выравнивании соответственно), однако степень сходства гораздо ниже, чем у других выбранных последовательностей.

Также стоит отметить, что при локальном выравнивании последовательностей с мнемониками FOLC и KAD процент покрытия оказался очень высоким (выше 90%), что указывает на то, что последовательности не имеют существенных различий в весе на определённых участках (характерно для FOLC).

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Характеристики глобального и локального парных выравниваний двух белков с разной мнемоникой
Algorithm ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Needle FOLD_ECOLI KCY_BACSU 32.0 15.5% 29.4% 34.8% 14 - -
Water FOLD_ECOLI KCY_BACSU 39.0 21.0% 38.1% 19.0% 4 30,2% 37,5%

В данном пункте сравнивались два белка с различной мнемоникой (Bifunctional protein FolD и Cytidylate kinase). Из результатов выравниваний можно сказать, что данные белки негомологичны, так как их степени идентичности меньше 25% (15.5% и 21.0% соответственно), а также выравнивания имеют очень маленький вес (32.0 и 39.0 соответственно). Кроме того, белки имеют разную длину (288 аминокислоты и 224 аминокислоты), что позволяет ещё больше удостовериться в том, что белки негомологичные, а их сходные участки - это лишь совпадение, не имеющее биологического веса.

Множественное выравнивание белков и импорт в Jalview

Для этого пункта задания был выбран белок D-aminoacyl-tRNA deacylase с мнемоникой DTD. Всего в Swiss-Prot нашлось 532 записи. Из них были отобраны следующие пять: DTD_ECOLI, DTD_YEAST, DTD_ACIBS, DTD_STRPJ и DTD_MYCTO.

Для выравнивания использовалась программа MUSCLE на kodomo.

Исходя из результатов выравнивания можно сделать вывод, что все эти белки гомологичны, так как в них есть достаточно длинные консервативные участки: 1-23, 29-60, 78-106, 129-149. Разные длины белков (появление гэпов и инделей), а также различие аминокислот в функциональных блоках можно объяснить точечными мутациями (делециями и инсерциями) в процессе эволюции.

Проект JalView