Практикум 13

Для работы был выбран белковый домен с AC: PF00106.

Для сравнения выравниваний одних и тех же последовательностей тремя разными программами (Mafft, Muscle, T-coffee) была выбрана программа, представленная ниже:

Macho.py

Выравнивание Jalview

Mafft и Muscle T-coffee и Mafft
Блоки одинаково вырoвненных колонок (80,83)-(82,85); (91,98)-(97,104); (134,135)-(146,147); (164,203)-(179,218); (217,219)-(234,236) (107,112)-(99,104); (160,161)-(146,147); (193,203)-(177,187); (211,227)-(194,210); (232,236)-(215,219); (253,255)-(234,236)
Одинаково выровненные колонки, не входящие в блоки (11,24)-(11,24) (9,24)-(9,24)

По результатам сравнения видно, что программы Mafft и T-coffee имеют больше совпавших блоков, чем mafft и muscle. Но в выравнивании Mafft и Muscle имеется большой блок совпадения длиной в 39 колонок: (164,203)-(179,218).

При этом, Mafft и T-coffee дают более похожие результаты выравнивания, потому что имеют больше соответствующих блоков, средняя длина которых больше, чем у Mafft и Muscle.

Совмещение структур и сравнение с программой MSA

В проекте Jalview представлены 2 выравнивания, сравненные вручную. Ннекоторые одинакого выровненные колонки, не входящие в блоки могут быть не вынесены в таблицу

структурное выравнивание
Структурное выравнивание
T-Coffee и PDB
Блоки одинаково вырoвненных колонок (3,26)-(2,25); (29,31)-(29,31); (84,95)-(85,96); (113,152)-(111,150); (166,167)-(186,187); (210,222)-(208,220); (246,255)-(244,253)
Одинаково выровненные колонки, не входящие в блоки (164,164)-(184,184); (172,192)-(192,192)

Идентичность последовательностей низкая, это видно и по структурному выравниванию, и по количеству совпавших блоков. тем не менее, у белков есть консервативный участок, который видно на фотографии (бета-складка). Возможно, в последовательсти этот участок приходится на блок (113,152)-(111,150), поскольку он является самым длинным совпавшим блоком.

Описание программы T-Coffee [1]:

T-Coffee — это программа для множественного выравнивания последовательностей, разработанная в 2000 году.

Она использует различные источники данных, которые предоставляются через библиотеку парных выравниваний. Может использоваться библиотека, которая была создана с использованием смеси локальных и глобальных парных выравниваний.

Алгоритм позволил повысить точность для отдалённо связанных последовательностей, при этом делая выравнивание быстро.

Программа позволяет учитывать выравнивания между всеми парами, при выполнении каждого шага множественного выравнивания. При добавлении новой последовательности, она выравнивается попарно со всеми уже выровненными. Это также позволяет исправлять появившиеся ранее ошибки, потому что мы рассматриваем каждую последовательность на каждом шаге выравнивания.

Источники

1. Notredame, C et al. “T-Coffee: A novel method for fast and accurate multiple sequence alignment.” Journal of molecular biology vol. 302,1 (2000): 205-17. doi:10.1006/jmbi.2000.4042