Учебный сайт Сергея Пушкарева

Навигация по сайту:

Практикум 9. Выравнивания

Глобальное выравнивание с помощью needle

Protein nameID1ID2Score% Identity% SimilarityGapsIndels
DNA topoisomerase 4 subunit APARC_ECOLIPARC_BACSU966.530.249.614025
Glutamyl-tRNA reductaseHEM1_ECOLIHEM1_BACSU697.531.255.6454
Acetate kinaseACKA_ECOLIACKA_BACSU8214363.62311

Локальное выравнивание с помощью water

Protein name ID1 ID2 Score % Identity % Similarity Gaps Indels % Coverage 1 % Coverage 2
DNA topoisomerase 4 subunit A PARC_ECOLI PARC_BACSU 969.5 31.8 52.3 97 22 95.6 96.3
Glutamyl-tRNA reductase HEM1_ECOLI HEM1_BACSU 698.5 34.3 60.8 9 2 97.1 89.5
Acetate kinase ACKA_ECOLI ACKA_BACSU 823.5 43.3 64.2 21 10 98.3 98.7

Для подсчета инделей в локальном и глобальном выравниваниях был написан небольшой bash-скрипт.

Выравнивание неродственных белков

В качестве неродственных белков были выбраны фосфоэтаноламин-трансфераза EptA (EPTA_ECOLI) и N-ацетилмурамоил-L-аланин амидаза BlyA (BLYA_BACSU).

Глобальное выравнивание с помощью needle

ID1 ID2 Score % Identity % Similarity Gaps Indels
EPTA_ECOLI BLYA_BACSU 22 4.4 7.6 666 13

Локальное выравнивание с помощью water

ID1 ID2 Score % Identity % Similarity Gaps Indels % Coverage 1 % Coverage 2
EPTA_ECOLI BLYA_BACSU 35 32 48 0 0 4.6 6.8

Комментарий: как видно из данных глобального выравнивания, выравнивание неродственных белков состоит преимущественно из протяженных инделей (которые, конечно, никакие не индели в биологическом смысле, так как белки имеют разное происхождение), например в рассматриваемом выравнивании на 13 инделей приходится 666 гэпов. Локальное выравнивание находит очень маленькие "гомологичные" участки по сравнению с тем, что было у гомологичных белков.

Сохранение выравнивания в формате fasta и его импорт в Jalview

Глобальное выравнивание белка ACKA_ECOLI и ACKA_BACSU в виде проекта Jalview.

Множественное выравнивание белков

С мнемоникой "PARC_*" в Swiss-Prot было найдено 37 белков. Из них были выбраны белки PARC_SALTY, PARC_STAAS, PARC_PSEAE, PARC_CAUVC, PARC_MYCGE. Проект Jalview. Все белки выровнялись хорошо и можно говорить об их гомологии. Крупные индели имеются в районе 500 аминокислотного остатка и на концах, причем на C-конце индель больше, чем на N-конце. Также можно отметить, что от N-конца до индели в районе 500 остатка рассматриваемые последовательности имеют большую консервативность, чем от этой же индели до С-конца.

© Пушкарев Сергей, 2018