Программа для сравнения выравниваний была предоставлена Машей Косаревой и Соней Грошевой. Передаю им спасибо ещё раз :)
Для выравнивания были взяты последовательности seed домена PF04547Б который использовался в предыдущем практикуме. Для выравнивания A было выбрано Mafft, B - ClustalO, C - Muscle. Проект с выравниваниями JalView.
| Показатель | Значение |
|---|---|
| Список блоков одинаково выровненных колонок | (1,18)=(1,18), (164,165)=(141,142), (181,182)=(163,164), (184,185)=(166,167), (260,267)=(239,246), (530,539)=(422,431), (570,597)=(451,478), (599,602)=(480,483), (1208,1209)=(832,833), (1386,1388)=(942,944), (1533,1549)=(1057,1073), (1576,1616)=(1100,1140), (1618,1620)=(1142,1144) |
| Список одинаково выровненных колонок, не входящих в блоки | - |
| Количество совпадающих колонок | 148 |
| Процент одинаково выровненных колонок первого выравнивания | 8.3% |
| Процент одинаково выровненных колонок второго выравнивания | 11.65% |
| Показатель | Значение |
|---|---|
| Список блоков одинаково выровненных колонок | (1,18)=(1,18), (138,141)=(127,130), (144,148)=(133,137, (260,267)=(237,244), (530,539)=(414,423), (570,609)=(442,481), (1386,1388)=(1081,1083), (1427,1431)=(1123,1127), (1541,1551)=(1190,1200), (1582,1588)=(1231,1237), (1595,1616)=(1244,1265), 1618,1620)=(1267,1269), (1676,1677)=(1314,1315) |
| Список одинаково выровненных колонок, не входящих в блоки | - |
| Количество совпадающих колонок | 143 |
| Процент одинаково выровненных колонок первого выравнивания | 8.02% |
| Процент одинаково выровненных колонок второго выравнивания | 10.11% |
По результатам становится видно, что выравнивание B больше похоже на A. Об этом свидетельствуют большее число совпавших колонок, а также более высокий процент одинакового выравнивания
Из интереса была проверена схожесть выравниваний B и C. Количество совпавших колонок - 209, а процент одинаково выровненных колонок первого и второго выравнивания соответственно: 16.46% и 14.77%
Выравнивания по ClustalO и Muscle имеют большую схожесть, чем выравнивание Mafft с любым из них.
| Показатель | Значение |
|---|---|
| Список блоков одинаково выровненных колонок | (23,27)=(8,12), (43,46)=(20,23), (53,59)=(24,30), (63,70)=(31,38), (71,78)=(40,47), (79,86)=(49,56), (87,97)=(59,69), (98,110)=(97,109), (133,136)=(132,135), (137,140)=(139,142), (144,148)=(143,147), (149,150)=(149,150) , (160,198)=(159,197), (204,233)=(203,232), (265,266)=(233,234), (267,268)=(272,273), (272,299)=(275,302), (300,306)=(304,310), (307,313)=(312,318), (314,316)=(320,322), (317,318)=(324,325), (331,333)=(326,328), (341,354)=(329,342), (355,358)=(344,347), (359,389)=(351,381), (419,422)=(417,420), (430,455)=(421,446), (475,478)=(447,450), (479,482)=(461,464), (486,493)=(465,472), (495,541)=(480,526), (542,576)=(528,562), (587,589)=(563,565), (590,599)=(573,582) , (604,622)=(585,603), (623,625)=(607,609), (626,627)=(614,615), (633,640)=(616,623), (668,671)=(626,629) |
| Список одинаково выровненных колонок, не входящих в блоки | - |
| Количество совпадающих колонок | 662 |
| Процент одинаково выровненных колонок первого выравнивания | 95.26% |
| Процент одинаково выровненных колонок второго выравнивания | 96.51% |
В этом задании были взяты 3 белка домена PF04547: 5nl2:A, 6qm9:A, 6e1o:A (A-цепь), совмещены их 3D структуры. При помощи PDbeFold и PyMOL были получены последовательность выравнивания и его визуализация соответственно
Также было сделано множественное выравнивание с помощью Mafft в JelView.
Из сравнения видно, что в целом последовательности и структуры хорошо совпадают в области общего домена. Это говорит о том, что белки достаточно близки эволюционно и сохраняют общий функциональный участок.
MAFFT (Multiple Alignment using Fast Fourier Transform) — программа для множественного выравнивания последовательностей, которая ускоряет поиск гомологий за счёт использования быстрого преобразования Фурье
Идея алгоритма в том, что аминокислотные последовательности переводятся в числовое представление, после чего сравнение выполняется не напрямую по символам, а через сигналы в частотном пространстве. Это позволяет быстро находить похожие участки даже в длинных последовательностях.
Далее MAFFT строит ориентировочное выравнивание с помощью метода парных сравнений и постепенно уточняет его итеративно, улучшая качество выравнивания.
1.Katoh K. et al. MAFFT: a novel method for rapid multiple sequence alignment based on fast Fourier transform, Nucleic Acids Research, 2002.