Выравнивание последовательностей
Петренко Павел
Факультет биоинженерии и биоинформатики, Московский Государственный Университет имени М.В.Ломоносова
Глобальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
D-aminoacyl-tRNA deacylase | DTD_ECOLI | DTD_BACSU | 303.0 | 40.4% | 58.2% | 10.3% | 2 |
Dihydrofolate synthase/folylpolyglutamate synthase | FOLC_ECOLI | FOLC_BACSU | 421.0 | 28.1% | 44.2% | 15.6% | 16 |
Adenylate kinase | KAD_ECOLI | KAD_BACSU | 527.5 | 46.4% | 65.8% | 5.9% | 3 |
Локальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
D-aminoacyl-tRNA deacylase | DTD_ECOLI | DTD_BACSU | 306.0 | 46.8% | 66.7% | 0.0% | 0 | 69,7% | 76,5% |
Dihydrofolate synthase/folylpolyglutamate synthase | FOLC_ECOLI | FOLC_BACSU | 430.0 | 29.6% | 46.1% | 13.8% | 14 | 93,8% | 92,1% |
Adenylate kinase | KAD_ECOLI | KAD_BACSU | 527.5 | 47.2% | 67.0% | 4.1% | 2 | 98,1% | 95,9% |
Комментарии к выравниваниям
При сравнении глобального и локального выравнивания видно, что локальное выравнивание является более точным. Это можно сказать благодаря сравнению веса выравниваний, процента идентичности и схожести.
Последовательности с мнемониками DTD и KAD мы можем назвать гомологичными, так как процент их идентичности достаточно высокий (40.4%/46.4% в глобальном выравнивании и 46.8%/47.2% в локальном выравнивании соответственно). Последовательности с мнемоникой FOLC также можно назвать гомологичными, так как их процент идентичности выше 25% (28.1%/29.6% в глобальном/локальном выравнивании соответственно), однако степень сходства гораздо ниже, чем у других выбранных последовательностей.
Также стоит отметить, что при локальном выравнивании последовательностей с мнемониками FOLC и KAD процент покрытия оказался очень высоким (выше 90%), что указывает на то, что последовательности не имеют существенных различий в весе на определённых участках (характерно для FOLC).
Результат применения программ выравнивания к неродственным белкам
Algorithm | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Needle | FOLD_ECOLI | KCY_BACSU | 32.0 | 15.5% | 29.4% | 34.8% | 14 | - | - |
Water | FOLD_ECOLI | KCY_BACSU | 39.0 | 21.0% | 38.1% | 19.0% | 4 | 30,2% | 37,5% |
В данном пункте сравнивались два белка с различной мнемоникой (Bifunctional protein FolD и Cytidylate kinase). Из результатов выравниваний можно сказать, что данные белки негомологичны, так как их степени идентичности меньше 25% (15.5% и 21.0% соответственно), а также выравнивания имеют очень маленький вес (32.0 и 39.0 соответственно). Кроме того, белки имеют разную длину (288 аминокислоты и 224 аминокислоты), что позволяет ещё больше удостовериться в том, что белки негомологичные, а их сходные участки - это лишь совпадение, не имеющее биологического веса.
Множественное выравнивание белков и импорт в Jalview
Для этого пункта задания был выбран белок D-aminoacyl-tRNA deacylase с мнемоникой DTD. Всего в Swiss-Prot нашлось 532 записи. Из них были отобраны следующие пять: DTD_ECOLI, DTD_YEAST, DTD_ACIBS, DTD_STRPJ и DTD_MYCTO.
Для выравнивания использовалась программа MUSCLE на kodomo.
Исходя из результатов выравнивания можно сделать вывод, что все эти белки гомологичны, так как в них есть достаточно длинные консервативные участки: 1-23, 29-60, 78-106, 129-149. Разные длины белков (появление гэпов и инделей), а также различие аминокислот в функциональных блоках можно объяснить точечными мутациями (делециями и инсерциями) в процессе эволюции.