Практикум 12

Сравнение выравнивания одних и тех же последовательностей тремя разными программами.

Для выравнивания были выбраны белки из 5 пункта 9 практикума: MIND_TUPAK, MIND_EMIHU, MIND_NEPOL, MIND_GUITH, MIND_SHIFL. В качестве программ для выравнивания были выбраны следующие 3 программы: MUSCLE, MAFFT, T-Coffee.

Ссылка на проект в Jalview

Рис. 1. Выравнивание MAFFT.
Рис. 2. Выравнивание MUSCLE.
Рис. 3. Выравнивание T-Coffee.
(s1,f1) (s2,f2) длина
(1-288) (1-288) 288
(297-299) (294-296) 3
(303-323) (300-320) 21
Таблица 1. Достоверные блоки относительно выравнивания по MAFFT - MUSCLE.
(s1,f1) (s2,f2) длина
(31-149) (31-149) 119
(152-201) (152-201) 50
(217-272) (217-272) 56
(275-288) (275-288) 14
(298-301) (295-298) 4
(304-315) (301-312) 12
(317) (314) 1
(319-320) (316-317) 2
(322) (319) 1
Таблица 2. Достоверные блоки относительно выравнивания по MAFFT - T-Coffee.

Общая длина достоверных колонок в выравнивании MAFFT - MUSCLE равна 312, а в выравнивании MAFFT - T-Coffee - 259. Из этого можно сделать вывод, что выравнивания MAFFT with Defaults и MUSCLE with defaults более схожи, чем MAFFT with Defaults и T-Coffee with Defaults. Это может означать, что программы выравнивания MUSCLE и MAFFT имеют более схожий алгоритм работы, чем MAFFT и T-Coffee.

Построение выравнивания по совмещению структур и сравнение его с выравниванием MSA

Для проведения 3D выравнивания было выбрано следующее семейство доменов из Pfam: PF00026. Выравнивались следующие три белка: 1E5O, 1CZI, 1APV.

Пространственное выравнивание осуществлялось с помощью Pairwise Structure Alignment (в качестве референса была взята структура 1E5O) на сайте PDB алгоритмом TM-align, обычное же выравнивание производилось с помощью программы MUSCLE в Jalview.

Рис. 4. Результат выравнивания трёх белковых последовательностей методом TM-align.
Рис. 5. Результат выравнивания трёх белковых последовательностей методом TM-align.
Рис. 6. Совмещение структур 1APV (зелен.), 1E5O (оранж.), 1CZI (син.).

Ссылка на проект в Jalview

Исходя из результатов сравнения двух выравниваний посредством программы Python, можно сделать вывод, что достоверные блоки относительно двух этих выравниваний: (15-63):(16-64). Всего один блок длиной 49 колонок.

Описание работы программы Muscle

Muscle – алгоритм множественного выравнивания последовательностей (с помощью логарифмического ожидания).

Алгоритм:

Этап 1. Прогрессивный этап. Цель первого этапа — произвести множественное выравнивание, делая упор на скорость, а не на точность.

  • 1. Создание матрицы расстояний, элементами которой являются расстояние k-меров ждя каждой пары последовательностей.
  • 2. На основе матрицы создается бинарное дерево
  • 3. Построение прогрессивного выравнивания в соответствии с порядком ветвления дерева с помощью алгоритма Нидлмана-Вунша: на каждом внутреннем узле строится парное выравнивание двух дочерних профилей, создавая новый профиль, который и назначается этому узлу. То есть происходит многократное выравнивание всех последовательностей.

Этап 2. Улучшенный прогрессивный этап. Повторная оценка дерева с помощью расстояния Кимуры, которое является более точным, чем приблизительная мера расстояний k-меров, но требует выравнивания.

  • 1. Создание матрицы расстояний, элементами которой являются расстояния Кимуры (1983) для каждой пары последовательности
  • 2. На основе матрицы создается бинарное дерево
  • 3. Построение прогрессивного выравнивания (аналогично предыдущему, с помощью алгоритма Нидлмана-Вунша), создается множественное выравнивание. Порядок ветвления поддеревьев в двух этапах разное.

Этап 3. Уточнение.

  • 1. Выбор ребра из дерева этапа 2 (ребро выбирается в порядке приближения к корню)
  • 2. Вычисление профиля множественного выравнивания каждого поддерева, которые получились путем удаления ребра из дерева.
  • 3. Новое множественное выравнивание строится путем выравнивания двух профилей.
  • 4. Если оценка SP (sum of pair) улучшается, то выравнивание сохраняется, а если нет, то сбрасывается. Шаги 1-4 повторяются, пока не будет достигнута сходимость или заданный пользователем предел.
Рис. 7. Схемы работы алгоритма Muscle.

Источники

В практикуме была использована программа Ксении Кирцовой

https://en.wikipedia.org/wiki/MUSCLE_(alignment_software)