Практикум 12. Алгоритмы и программы множественного выравнивания.

1. Алгоритм сравнения разных выравниваний одних и тех же последовательностей

Программа для сравнения выравниваний была предоставлена Машей Косаревой и Соней Грошевой. Передаю им спасибо ещё раз :)

2. Сравнение выравниваний одних и тех же последовательностей тремя разными программами A, B, C

Для выравнивания были взяты последовательности seed домена PF04547Б который использовался в предыдущем практикуме. Для выравнивания A было выбрано Mafft, B - ClustalO, C - Muscle. Проект с выравниваниями JalView.

Показатель Значение
Список блоков одинаково выровненных колонок (1,18)=(1,18), (164,165)=(141,142), (181,182)=(163,164), (184,185)=(166,167), (260,267)=(239,246), (530,539)=(422,431), (570,597)=(451,478), (599,602)=(480,483), (1208,1209)=(832,833), (1386,1388)=(942,944), (1533,1549)=(1057,1073), (1576,1616)=(1100,1140), (1618,1620)=(1142,1144)
Список одинаково выровненных колонок, не входящих в блоки -
Количество совпадающих колонок 148
Процент одинаково выровненных колонок первого выравнивания 8.3%
Процент одинаково выровненных колонок второго выравнивания 11.65%
Основная информация о сравнении A и B
Показатель Значение
Список блоков одинаково выровненных колонок (1,18)=(1,18), (138,141)=(127,130), (144,148)=(133,137, (260,267)=(237,244), (530,539)=(414,423), (570,609)=(442,481), (1386,1388)=(1081,1083), (1427,1431)=(1123,1127), (1541,1551)=(1190,1200), (1582,1588)=(1231,1237), (1595,1616)=(1244,1265), 1618,1620)=(1267,1269), (1676,1677)=(1314,1315)
Список одинаково выровненных колонок, не входящих в блоки -
Количество совпадающих колонок 143
Процент одинаково выровненных колонок первого выравнивания 8.02%
Процент одинаково выровненных колонок второго выравнивания 10.11%
Основная информация о сравнении A и C

По результатам становится видно, что выравнивание B больше похоже на A. Об этом свидетельствуют большее число совпавших колонок, а также более высокий процент одинакового выравнивания

Доп.

Из интереса была проверена схожесть выравниваний B и C. Количество совпавших колонок - 209, а процент одинаково выровненных колонок первого и второго выравнивания соответственно: 16.46% и 14.77%

Выравнивания по ClustalO и Muscle имеют большую схожесть, чем выравнивание Mafft с любым из них.

Выравнивание по совмещению структур и сравните его с выравниванием программой MSA

Показатель Значение
Список блоков одинаково выровненных колонок (23,27)=(8,12), (43,46)=(20,23), (53,59)=(24,30), (63,70)=(31,38), (71,78)=(40,47), (79,86)=(49,56), (87,97)=(59,69), (98,110)=(97,109), (133,136)=(132,135), (137,140)=(139,142), (144,148)=(143,147), (149,150)=(149,150) , (160,198)=(159,197), (204,233)=(203,232), (265,266)=(233,234), (267,268)=(272,273), (272,299)=(275,302), (300,306)=(304,310), (307,313)=(312,318), (314,316)=(320,322), (317,318)=(324,325), (331,333)=(326,328), (341,354)=(329,342), (355,358)=(344,347), (359,389)=(351,381), (419,422)=(417,420), (430,455)=(421,446), (475,478)=(447,450), (479,482)=(461,464), (486,493)=(465,472), (495,541)=(480,526), (542,576)=(528,562), (587,589)=(563,565), (590,599)=(573,582) , (604,622)=(585,603), (623,625)=(607,609), (626,627)=(614,615), (633,640)=(616,623), (668,671)=(626,629)
Список одинаково выровненных колонок, не входящих в блоки -
Количество совпадающих колонок 662
Процент одинаково выровненных колонок первого выравнивания 95.26%
Процент одинаково выровненных колонок второго выравнивания 96.51%
Сравнение выравниваний последовательностей домена PF04547: 5nl2:A, 6qm9:A, 6e1o:A

В этом задании были взяты 3 белка домена PF04547: 5nl2:A, 6qm9:A, 6e1o:A (A-цепь), совмещены их 3D структуры. При помощи PDbeFold и PyMOL были получены последовательность выравнивания и его визуализация соответственно

Structural alignment of PF04547 proteins
Наложение структур трёх белков домена PF04547

Также было сделано множественное выравнивание с помощью Mafft в JelView.

Из сравнения видно, что в целом последовательности и структуры хорошо совпадают в области общего домена. Это говорит о том, что белки достаточно близки эволюционно и сохраняют общий функциональный участок.

Краткое описание программы MAFFT

MAFFT (Multiple Alignment using Fast Fourier Transform) — программа для множественного выравнивания последовательностей, которая ускоряет поиск гомологий за счёт использования быстрого преобразования Фурье

Идея алгоритма в том, что аминокислотные последовательности переводятся в числовое представление, после чего сравнение выполняется не напрямую по символам, а через сигналы в частотном пространстве. Это позволяет быстро находить похожие участки даже в длинных последовательностях.

Далее MAFFT строит ориентировочное выравнивание с помощью метода парных сравнений и постепенно уточняет его итеративно, улучшая качество выравнивания.

Источники

1.Katoh K. et al. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform, Nucleic Acids Research, 2002.

2. MAFFT official documentation