← Назад к списку работ
Практикум №12: Сравнение множественных выравниваний
Домен: PF00018 (SH3 domain)
Использованные последовательности: VAV_HUMAN, HSE1_YEAST, MYOC_DICDI (SH3 домены)
2. Сравнение выравниваний разными программами
Сравнение A (seed Pfam) vs B (ClustalO)
| № блока | Позиции в A (seed) | Позиции в B (ClustalO) | Длина |
| 1 | (1,7) | (1,7) | 7 |
| 2 | (10,11) | (11,12) | 2 |
| 3 | (15,20) | (15,20) | 6 |
| 4 | (22,29) | (22,29) | 8 |
| 5 | (32,34) | (32,34) | 3 |
| 6 | (36,40) | (36,40) | 5 |
| 7 | (42,43) | (42,43) | 2 |
| 8 | (45,46) | (45,46) | 2 |
| 9 | (48,49) | (48,49) | 2 |
| 10 | (50,51) | (50,51) | 2 |
| 11 | (53,56) | (53,56) | 4 |
Всего одинаково выровненных колонок: 43 (из ~56).
Отдельных одинаково выровненных колонок, не входящих в блоки: нет.
Сравнение A (seed Pfam) vs C (MAFFT)
| № блока | Позиции в A (seed) | Позиции в C (MAFFT) | Длина |
| 1 | (1,7) | (1,7) | 7 |
| 2 | (10,11) | (10,11) | 2 |
| 3 | (14,17) | (14,17) | 4 |
| 4 | (19,20) | (19,20) | 2 |
| 5 | (22,24) | (22,24) | 3 |
| 6 | (27,29) | (27,29) | 3 |
| 7 | (32,33) | (32,33) | 2 |
| 8 | (35,38) | (35,38) | 4 |
| 9 | (40,41) | (40,41) | 2 |
| 10 | (43,44) | (43,44) | 2 |
| 11 | (46,47) | (46,47) | 2 |
| 12 | (49,50) | (49,50) | 2 |
| 13 | (52,55) | (52,55) | 4 |
Всего одинаково выровненных колонок: 39 (из ~56).
Отдельных одинаково выровненных колонок, не входящих в блоки: нет.
Вывод по заданию 2:
Выравнивание, полученное программой ClustalO (B), больше похоже на эталонное выравнивание Pfam seed (A), чем выравнивание, полученное программой MAFFT (C).
ClustalO сохраняет более длинные непрерывные участки без гэпов.
Файлы для проверки (задание 2)
3. Сравнение структурного и MSA-выравниваний
Техническое примечание:
Сервер PDBeFold на момент выполнения работы был недоступен (ошибка Internal Server Error 500).
Получить структурное выравнивание не представилось возможным.
MSA-выравнивание (ClustalO)
Для трёх последовательностей SH3-доменов (VAV_HUMAN, HSE1_YEAST, MYOC_DICDI) было построено множественное выравнивание программой ClustalO.
Теоретическое описание (если бы сервер работал):
При сравнении структурного выравнивания (полученного через PDBeFold) с MSA-выравниванием ожидается, что консервативные участки (например, мотив GWWRG, пролин-богатые участки) совпадут в обоих выравниваниях.
Расхождения могут наблюдаться в петлевых участках, где 3D-структура позволяет более точно определить положение аминокислот, в то время как MSA может ошибаться из-за низкой консервативности последовательности.
PDBeFold PDB ID для структурного выравнивания: 1KZQ (VAV_HUMAN), 4NAC (HSE1_YEAST), 5X6R (MYOC_DICDI).
4. Описание программы MSA: Clustal Omega
Clustal Omega
Clustal Omega — это программа для множественного выравнивания последовательностей, разработанная в 2011 году сотрудниками EBI (Sievers et al., 2011).
Она пришла на смену ClustalW и ClustalX.
Алгоритм: Clustal Omega использует прогрессивное выравнивание, но с улучшенной эвристикой. Основные этапы:
- Построение попарных выравниваний с помощью mBed — метода, основанного на k-мерах.
- Построение направляющего дерева (guide tree) методом UPGMA или Neighbor-Joining на основе попарных расстояний.
- Прогрессивное выравнивание от листьев к корню дерева с использованием динамического программирования.
- Итеративное улучшение (рефайнмент) выравнивания.
Особенности: Clustal Omega эффективно работает с большими наборами последовательностей (тысячи и десятки тысяч).
Поддерживает различные алгоритмы для построения направляющего дерева и может использовать скрытые марковские модели (HMM) из Pfam.
Источник: Sievers F., Wilm A., Dineen D. et al. Fast, scalable generation of high‑quality protein multiple sequence alignments using Clustal Omega.
Mol. Syst. Biol. 7, 539 (2011).
https://www.ebi.ac.uk/Tools/msa/clustalo/
Файлы для проверки (задание 4)
Файлы для проверки
← Назад к списку работ