1. Сравнение выравнивания одних и тех же последовательностей программами MSAprobs, MAFFT, T-Coffee

Для выравнивания были выбраны белки из 9 практикума, 5 пункта: ARAA_SALTY, ARAA_SHIFL, ARAA_THEP1, ARAA_SHISS, ARAA_LEPCP. Множественное выравнивание я делала с помощью программ: MSAprobs, MAFFT, T-Coffee.

Рис.1 Выравнивание MSAprobs.

Рис. 2 Выравнивание MAFFT.

Рис. 3. Выравнивание T-Coffee.

Ссылка на проект в Jalview.

Для выполнения этого задания я пользовалась программой самой Ксении Кирцовой!!!༘˚⋆𐙚。⋆𖦹.✧˚.

(s1,f1)(s2,f2)длина
(1-240)(1-240)240
(254-359)(263-368)106
(363-501)(374-512)139

Таблица 1. Достоверные блоки относительно выравнивания по T-Coffee - MSAprobs.

(s1,f1)(s2,f2)длина
(1-233)(1-233)233
(253-359)(260-366)107
(363-496)(370-503)134
(498)(505)1

Таблица 2. Достоверные блоки относительно выравнивания по T-Coffee - MAFFT.

Общая длина достоверных колонок в выравнивании T-Coffee - MSAprobs равна 485, а в выравнивании T-Coffee - MAFFT - 475. Исходя из этого, можно сделать вывод, что выравнивания T-Coffee with Defaults и MSAprobs with defaults более схожи, чем T_Coffee with Defaults и MAFFT with Defaults. Скорее всего, это означает, что программы выравнивания T-Coffee и MSAprobs имеют более схожий алгоритм работы.

2. Построение выравнивание по совмещению структур и сравнение его с выравниванием MSA

Для выполнения задания я выбрала белки с доменами из семейства: Hom_end (AC:PF05204), а именно: PDB_ID: 1EF0, 1UM2, 1VDE. В качестве референсного белка был взят 1EF0.

Пространственное выравнивание было выполнено с помощью Pairwise Structure Alignment на сайте PDB алгоритмом TM-align.

Рис. 4 Результат выравнивания трёх белковых последовательностей.

Рис. 5 Результат выравнивания трёх белковых последовательностей.

Рис. 6 Совмещение структур 1EF0, 1UM2, 1VDE, где 1EF0 - оранжевый, 1UM2 - синий, 1VDE - зелёный.

Затем с помощью текстового редактора я сделала множественное выравнивание.

Еще одно обычное выравнивание производилось с помощью программы MUSCLE в Jalview. Далее, снова благодаря гениальной Ксении Кирцовой, можно увидеть список достоверных блоков блоков относительно этих выравниваний:

(s1,f1)(s2,f2)длина
(1-2)(1-2)2

Таблица 3. Достоверные блоки относительно выравниваний.

4. Краткое описание прогораммы T-Coffee.

T-Coffee - это прогрессивное множественное выравнивание с возможностью учитывать информацию из всех последовательностей на каждом шаге выравнивания, а не только из тех, которые выравниваются на данном этапе.

Алгоритм

T-Coffee (Tree-based Consistency Objective Function for Alignment Evaluation) имеет две основные особенности:

1. Она обеспечивает простой и легко выполнимый способ генерации множественных выравниваний с использованием разнородных источников данных. Данные из этих источников предоставляются T-Coffee через библиотеку парных выравниваний.

2. Метод оптимизации, который используется для поиска множественного выравнивания, которое наилучшим образом соответствует парным выравниваниям во входной библиотеке. В этом выравнивании используется прогрессивная стратегия, которая аналогична той, что применяется в ClustalW. Ее преимущество в том, что она быстрая и относительно надежная.

Рис. 4 Схема, кратко иллюстрирующая алгоритм работы программы T-Coffee.

4. Источники:

  • T-Coffee