Практикум 12

Задание 1. Сравнение выравниваний одних и тех же последовательностей разными программами.

Проект Jalview с тремя выравниваниями

Выравнивания в формате FASTA:

1. T-Coffee
2. Muscle
3. Mafft

Для получения сравнения выравниваний использовался код написанный моей однокурсницей

Сравнения выравниваний

Таблица 1. MUSCLE и MAFFT
совпадающие участки
Muscle Mafft
1 (25,38) (28,41)
2 (58,60) (56,58)
3 (106,110) (111,115)
4 (418,421) (460,463)
5 (457,473) (500,516)
6 (484,527) (527,570)
7 (542,566) (579,603)
8 (718,724) (796,802)
9 (573,627) (610,664)
Таблица 2. MUSCLE и MAFFT
несовпадающие участки
Muscle Mafft
1 (1, 24) (1, 27)
2 (39, 57) (42, 55)
3 (61, 105) (59, 110)
4 (111, 417) (116-459)
5 (422, 456) (464, 499)
6 (474, 483) (517, 526)
7 (528, 541) (571, 578)
8 (567, 572) (604, 609)
9 (628,717) (665, 795)

Также в данных выравниваниях присутствуют совпадающие колонки вне блоков: (11,11), (666,629) для Muscle и Mafft соответственно.

При сравнении программ было обнаружено 9 совпадающих блоков (160 колонок) самый длинный из которых состоял из 55 колонок. Большое количество длинных блоков совпадений свидетельствует о схожести в работе этих алгоритмов.

Таблица 1. T-Coffee и MAFFT
совпадающие участки
Mafft T-Coffee
1 (29,41) (30,42)
2 (57,58) (57,58)
3 (111,114) (110,113)
4 (281,282) (290,291)
5 (327,357) (357,387)
6 (360,375) (390,405)
7 (435,444) (468,477)
8 (411,414) (444,447)
9 (460,463) (493,496)
10 (500,516) (535,551)
11 (527,563) (562,598)
12 (580,592) (615,627)
13 (597,603) (632,638)
14 (620,622) (676,678)
15 (642,664) (865,887)
16 (796,802) (978,984)
Таблица 2. T-Coffee и MAFFT
несовпадающие участки
Mafft T-Coffee
1 (1,28) (1,29)
2 (42, 56) (43, 56)
3 (59, 110) (59-109)
4 (115, 280) (114, 289)
5 (283, 326) (292, 356)
6 (358, 359) (388, 389)
7 (376, 410) (406, 443)
8 (415, 434) (448, 467)
9 (445, 459) (478, 492)
10 (464, 499) (497, 534)
11 (517, 526) (552, 561)
12 (564, 579) (599, 614)
13 (593, 596) (628, 631)
14 (604, 619) (639, 675)
15 (623, 641) (679, 864)
16 (665, 795) (888, 977)

Также присутствует четыре совпадения вне блоков: колонки (27, 26), (277,286), (570,605), (666,889) Для Mafft и T-Coffee соответственно.

Было обнаружено 16 блоков совпадения (180 колонок), самый длинный из которых был длиной 37 а.к.о.

Процент совпадения Mafft с Muscle и T-Coffee равны 21.9% и 24.6% соответственно. Выравнивания имеют схожие количества совпадающих колонок, однако число блоков отличается почти в два раза. Возможно это связанно с особенностями строения белка и спецификой работы каждой из программ.

Задание 2. Выравнивание по совмещению структур.

Проект Jalview с двумя выравниваниями

Выравнивания в формате FASTA:

1. PDBeFold
2. Muscle

Сравнения выравниваний

Таблица 1. MUSCLE и PDBeFold
совпадающие участки
Muscle PDBeFold
1 (1, 105) (1, 105)
2 (142, 170) (143, 171)
3 (183, 214) (184, 215)
4 (579, 594) (878, 893)
Таблица 2. MUSCLE и PDBeFold
несовпадающие участки
Muscle PDBeFold
1 (106, 141) (106, 142)
2 (171,182) (171, 183)
3 (215,578) (216, 877)

Рис 1. Совмещение 3D-струкрур 3 белков
Розовый - 6fj3:
Зеленый - 4k5y:A
Синий - 5ee7:A

Были проанализированы выравнивания 3х последовательсностей А-цепей белков из домена 7 transmembrane receptor (rhodopsin family) (PF00001): 4K5Y, 5EE7, 6FJ3. Имеется четыре схожих блоков в выравниваниях длиной 105, 32, 29 и 15 а.о. Можно сделать вывод, что Muscle правильно выравнял последовательности, близко к структурному.

Задание 3. Описание программы T-Coffee.

T-coffee (Tree-based Consistency Objective Function for Alignment Evaluation) - программное обеспечение для выравнивания нескольких последовательностей. Программа основана на прогрессивном выравнивании. Впервые было представлено в 2000 году. Разработчики: Cédric Notredame, Centro de Regulacio Genomica (CRG) - Барселона.

На что способна эта программа:

Ссылка с данными о программе