На страницу II-ого семестра
В базе данных SMART получили изображение доменной структуры белка BIOB_Ecoli. Выбрали домен Eps3 и получили эталонное выравнивание доменов, гомологичных нашему.
Из эталонного выравнивания вырезали фрагмент длинной 63 а.о. и шириной 5 последовательностей:
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 6 | 0 |   |   |   |   |   |   |   |   |   |
| M | O | A | A | _ | B | A | C | S | U |   | : |   | R | V | T | I | S | L | D | S | L | E | D | E | R | F | K | K | I | N | G | R | G | V | S | V | S | K | V | L | E | G | I | E | A | A | K | Q | A | G | - | - | L | G | V | K | I | N | M | V | V | - | Q | K | G | V | N | E | K | D | I | L | P | M | A | R |   | : |   | 6 | 1 |
| B | I | O | B | _ | Y | E | A | S | T |   | : |   | A | Y | N | H | N | I | D | T | S | R | E | H | Y | S | K | - | - | V | I | T | T | R | T | Y | D | D | R | L | Q | T | I | K | N | V | Q | E | S | G | - | - | I | K | A | C | T | G | G | I | L | G | L | G | - | E | S | E | D | D | H | I | G | F | I | Y |   | : |   | 5 | 9 |
| H | E | M | N | _ | B | R | A | J | A |   | : |   | R | A | S | L | G | V | Q | S | F | D | P | I | V | Q | R | A | - | I | N | R | I | Q | S | F | E | Q | T | A | A | V | V | D | M | L | R | H | A | G | - | I | A | G | I | N | F | D | L | I | Y | G | L | P | H | Q | T | V | A | S | C | L | D | T | V | R |   | : |   | 6 | 2 |
| Y | Q | E | V | _ | B | A | C | S | U |   | : |   | H | L | H | I | P | I | Q | S | G | S | N | T | V | L | K | R | - | M | R | R | K | Y | T | M | E | F | F | A | D | R | L | N | K | L | K | K | A | L | P | G | L | A | V | T | S | D | V | I | V | G | F | P | G | E | T | E | E | E | F | M | E | T | Y | N |   | : |   | 6 | 3 |
| H | E | M | N | _ | A | Q | U | A | E |   | : |   | R | I | S | L | G | V | Q | D | L | D | P | K | V | Q | Q | A | - | V | N | R | V | Q | P | Y | E | L | I | K | E | K | M | E | K | L | R | E | A | G | - | F | E | S | I | N | L | D | L | I | Y | G | L | P | Y | Q | T | K | E | S | F | E | K | T | V | E |   | : |   | 6 | 2 |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | 6 |   |   |   |   |   |   |   |   |   |   |   |   |   | r |   |   |   |   |   |   |   |   |   |   | 6 |   |   |   |   |   | a | g |   |   |   |   |   |   |   |   |   | 6 |   | g |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Для построения множественного выравнивания сначала получили полные аминокислотные последовательности с помощью SRS, которые сохранили в файле full_seq.fasta . Множественное выравнивание этих 5-ти последовательностей строили с помощьб программы ClustalW (emma из пакета EMBOSS). После этого полученный файл выравнивания импортировали в GenDoc. Строки нашего множественного выравнивания, соответствующие строкам эталонного выравнивания раскрасили фиолетовым цветом.
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 6 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   | 8 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 0 | 0 |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
| M | O | A | A | _ | B | A | C | S | U |   | : |   | R | V | T | I | S | L | D | S | L | E | D | E | R | F | K | K | I | N | G | R | G | V | S | V | S | K | V | L | E | G | I | E | A | A | K | Q | A | G | L | G | V | K | I | N | M | V | V | Q | K | G | V | N | E | K | D | I | L | P | M | A | R | Y | F | K | E | K | G | H | I | L | R | F | I | E | F | M | D | V | G | N | T | N | Q | W | E | K | K | D | V | M | T | K | A | E | I | I | D | L | I | N | K | H | M | P | V | E | P | I |   | : |   | 1 | 0 | 8 |
| B | I | O | B | _ | Y | E | A | S | T |   | : |   | K | R | N | G | S | T | R | F | C | L | G | A | A | W | R | D | M | K | G | R | K | S | A | M | K | R | I | Q | E | M | V | T | K | V | N | D | M | G | L | E | T | C | V | T | L | G | M | V | D | Q | D | Q | A | K | Q | L | K | D | A | G | L | T | A | Y | N | H | N | I | D | T | S | R | E | H | Y | S | K | V | I | T | T | R | T | Y | D | D | R | L | Q | T | I | K | N | V | Q | E | S | G | I | K | A | C | T | G | G | I | L | G |   | : |   | 1 | 0 | 8 |
| H | E | M | N | _ | B | R | A | J | A |   | : |   | N | R | A | S | L | G | V | Q | S | F | D | P | I | V | Q | R | A | I | N | R | I | Q | S | F | E | Q | T | A | A | V | V | D | M | L | R | H | A | G | I | A | G | I | N | F | D | L | I | Y | G | L | P | H | Q | T | V | A | S | C | L | D | T | V | R | R | S | L | L | L | A | P | D | R | F | S | V | F | G | Y | A | H | V | P | D | F | K | K | H | Q | R | M | I | N | Q | G | A | L | P | D | G | P | A | R | H | D | Q | A | C | A |   | : |   | 1 | 0 | 8 |
| Y | Q | E | V | _ | B | A | C | S | U |   | : |   | F | C | I | I | P | W | A | R | G | L | L | R | S | R | D | P | E | E | V | I | K | Q | A | Q | Q | L | V | D | A | G | Y | K | E | I | V | L | T | G | I | H | T | G | G | Y | G | E | D | M | K | D | Y | N | F | A | K | L | L | S | E | L | D | T | R | V | E | G | V | K | R | I | R | I | S | S | I | E | A | S | Q | I | T | D | E | V | I | E | V | L | D | R | S | D | K | I | V | N | H | L | H | I | P | I | Q | S | G | S | N | T |   | : |   | 1 | 0 | 8 |
| H | E | M | N | _ | A | Q | U | A | E |   | : |   | N | R | I | S | L | G | V | Q | D | L | D | P | K | V | Q | Q | A | V | N | R | V | Q | P | Y | E | L | I | K | E | K | M | E | K | L | R | E | A | G | F | E | S | I | N | L | D | L | I | Y | G | L | P | Y | Q | T | K | E | S | F | E | K | T | V | E | K | V | I | E | L | N | P | D | R | I | A | T | Y | S | F | A | Y | I | P | Q | V | K | P | H | Q | Q | L | L | P | K | E | A | L | P | S | A | E | E | K | L | R | I | F | E | M |   | : |   | 1 | 0 | 8 |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | r |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | G |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 2 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   | 1 | 4 | 0 |   |   |   |   |   |   |   |   |   | * |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
| M | O | A | A | _ | B | A | C | S | U |   | : |   | A | P | N | Y | I | G | E | V | A | S | R | F | R | Y | L | D | G | S | G | E | I | G | - | - | V | I | S | S | V | S | D | A | F | C | G | S | C | N | R | A | R | L | S | A | R | G | E | L | F | T | C |   | : |   | 1 | 5 | 7 |
| B | I | O | B | _ | Y | E | A | S | T |   | : |   | L | G | E | S | E | D | D | H | I | G | F | I | Y | T | L | S | N | M | S | P | H | P | E | S | L | P | I | N | R | L | V | A | I | K | G | T | P | M | A | E | E | L | A | D | P | K | S | K | K | L | Q |   | : |   | 1 | 5 | 9 |
| H | E | M | N | _ | B | R | A | J | A |   | : |   | I | A | N | A | L | K | E | A | G | Y | V | Q | I | G | L | D | H | F | A | R | P | D | D | S | M | A | V | A | F | E | E | R | T | L | R | R | N | F | Q | G | Y | T | T | D | Q | G | E | V | L | L | G |   | : |   | 1 | 5 | 9 |
| Y | Q | E | V | _ | B | A | C | S | U |   | : |   | V | L | K | R | M | R | R | K | Y | T | M | E | F | F | A | D | R | L | N | K | L | K | K | A | L | P | G | L | A | V | T | S | D | V | I | V | G | F | P | G | E | T | E | E | E | F | M | E | T | Y | N |   | : |   | 1 | 5 | 9 |
| H | E | M | N | _ | A | Q | U | A | E |   | : |   | V | I | N | K | F | Q | E | A | G | Y | V | Y | I | G | M | D | H | F | A | K | P | E | D | E | L | A | V | A | Q | R | K | G | E | L | W | R | N | F | Q | G | Y | T | T | K | K | G | V | E | L | L | G |   | : |   | 1 | 5 | 9 |
|   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   | d |   |   |   |   |   |   |   |   | 6 |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |   |
Итак, сравним эталонное выравнивание и наше множественное выравнивание.
Во множественном выравнивании из файла clustalw.msf есть только две последовательности (HEMN_BRAJA и HEMN_AQUAE), для которых колонки из эталонного выравнивания совпали с нашим выравниванием, причем совпали 62 из 64 колонок, отсутствуют 2 колонки с гэпами. Следует также заметить, что совпавшие последовательности принадлежат по-видимому ортологам (здесь было несколько нарушено условие задания, что надо выбирать последовательности с идентификаторами различающие как по первой части, так и по второй части имени, но это было продиктовано качеством эталонного выравнивания.) Программа ClustalW, так построила множественное выравнивание, что "строки эталонного выравнивания" оказались сдвинуты друг относительно друга. Из всего выше сказанного можно сделать вывод, что эталонное выравнивание и выравнивание из ClustalW различаются очень сильно.
Из того, что ClustalW построил выравнивание, так сильно отличающиеся от эталонного, не следует делать вывод, что это плохая программа. Очевидно, такое выравнивание продиктовано объективными причинами, связанными с особенностями алгоритма ClustalW.
Матрица эталонного фрагмента выравнивания.
MOAA_BACSU BIOB_YEAST HEMN_BRAJA YQEV_BACSU HEMN_AQUAE
MOAA_BACSU 100%
BIOB_YEAST 11% 100%
HEMN_BRAJA 14% 6% 100%
YQEV_BACSU 17% 11% 22% 100%
HEMN_AQUAE 11% 11% 53% 23% 100%
Матрица фрагмента выравнивания, построенного в Clustal.
MOAA_BACSU BIOB_YEAST HEMN_BRAJA YQEV_BACSU HEMN_AQUAE
MOAA_BACSU 100%
BIOB_YEAST 9% 100%
HEMN_BRAJA 8% 6% 100%
YQEV_BACSU 7% 8% 6% 100%
HEMN_AQUAE 8% 7% 47% 10% 100%
Из матриц попарного сходства видно, что эталонное выравнивание несколько лучше, чем наше выравнивание.
Вообщем, по каким-то не до конца понятным причинам ClustalW построил не очень удачное выравнивание наших последовательностей:(