1. Характеристики глобального парного выравнивания трёх пар белков
Protein name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
Copper-exporting P-type ATPase | COPA_ECOLI | COPA_BACSU | 1488 | 39.9 | 57.9 | 94 | 17 |
Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216 | 60.3 | 71.8 | 1 | 0 |
30S ribosomal protein S10 | RS10_ECOLI | RS10_BACSU | 346 | 63.1 | 81.6 | 1 | 0 |
2. Лoкальное парное выравнивание гомологичных белков
Protein name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1, % | Coverage 2, % |
Copper-exporting P-type ATPase | COPA_ECOLI | COPA_BACSU | 1488.5 | 40.1 | 58.1 | 89 | 14 | 99.2 | 99.3 |
Acyl carrier protein | ACP_ECOLI | ACP_BACSU | 216 | 61 | 72.7 | 0 | 0 | 98.7 | 100 |
30S ribosomal protein S10 | RS10_ECOLI | RS10_BACSU | 346 | 63.7 | 82.4 | 0 | 0 | 99 | 100 |
3. Результат применения программ выравнивания к неродственным белкам
Глобальное выравнивание
Protein name 1 | Protein name 2 | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
Signal peptidase I (Spase I) | DNA repair protein RadA | LEP_ECOLI | RADA_BACSU | 15 | 4.1 | 8.9 | 548 | 8 |
Локальное выравнивание
Protein name 1 | Protein name 2 | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1, % | Coverage 2, % |
Signal peptidase I (Spase I) | DNA repair protein RadA | LEP_ECOLI | RADA_BACSU | 34.5 | 19 | 34.2 | 61 | 8 | 41.98 | 37.3 |
Комментарии к выравниваниям
На примере выравниваний различных гомологичных белков видим, что величина под названием вес (Score) выравнивания не очень информативна. Первая пара, по-видимому, набирает большой вес из-за большой длины последовательностей (больше 800 аминокислот), хотя выбранные белки не очень похожи.
В данном случае для гомологичных белков локальное выравнивание практически не отличается от глобального. В случае с негомологичными белками это не так: локальное выравнивание существенно увеличивает показатели "Identity" и "Similarity" и уменьшает количество гэпов.
4. Сохранение выравнивания в fasta-формате и импорт в Jalview
Глобальное выравнивание белков ACP_ECOLI и ACP_BACSU в виде проекта Jalview
5. Множественное выравнивание белков
Множественное выравнивание 30S рибосомальных белков S10 в виде проекта Jalview
Всего было найдено 835 белков с мнемоникой функции "RS10". Для выравнивания, помимо белков кишечной и сенной палочек, были выбраны белки мыши, человека, археи и ещё двоих бактерий. Рибосомальные белки мыши и человека, как и следовало ожидать, очень похожи друг на друга (отличаются всего на две аминокислоты, причём одна из них специфична для мыши: фенилаланин вместо лейцина в 119 позиции). Если судить по данному выравниванию о родстве организмов, то E.coli ближе всего оказывается к сальмонелле (Salmonella typhimurium), чуть подальше от неё оказывается сенная палочка (Bacilus subtilis), ещё дальше - Phytoplasma australiense, затем - архея Sulfolobus islandicus, а потом - человек и мышь. Мышь и человек имеют несколько длинных вставок. На выравнивающихся участках можно увидеть консервативные аминокислоты. Таковы, например, изолейцин в 11 позиции, глицин в 59 и ещё четыре аминокислоты. В выравнивании консервативные участки перемежаются с неконсервативными. Несмотря на малое сходство белков млекопитающих с белками бактерий, вероятно, мы вправе считать их гомологичными, особенно если принять во внимание, что мы имеем дело с рибосомальными белками, которые лежат в основе аппарата синтеза белка любого организма.
© Быкова Даша, 2018