Colloquium

~mashkovskayaav

Сравнение множественных выравниваний

► Для данного задания были выбраны белки FOLD_CHLAA, FOLD_ECOLI и FOLD_HELPY из банка данных Uniprot. При построении выравниваний были использованы следующие программы Jalview: Muscle, Mafft и GLprobs. Выравнивания Glprobs-Mafft-Muscle соответственно.

При сравнении выравниваний было обнаружено много существенных различий, далее будут рассмотрены лишь три из них.

1) Колонка №1

Различия появляются уже в первой колонке выравнивания:


В выравнивании Muscle в первой колонке стоит три метионина, в то время как в выравниваниях Mafft и GLprobs метионин (Met 1) третьей последовательности сопоставлен гепам в первой и второй последовательностях. (Рисунок 1)

В общем случае можно утвержать, что в программах Mafft и GLprobs предпочтение отдается концевым гепам.



Рисунок 1

2) Колонка №67

В колонке 67 видна разница между выравниванием Mafft и двумя другими выравниваниями.

В выравниях GLprobs и Мuscle в последовательности FOLD_HELPY в колонке 67 стоит аспартат (Asp 67), а в последовательности, выравненной Mafft, на этом месте стоит геп.(Рисунок 2)

Стоит заметить, что до этого момента выравнивания Mafft и GLprobs практически совпадали, теперь же начинают появляться различия между всеми тремя выравниваниями.



Рисунок 2



3) Колонка №288

В колонке 288 проявляется разница между всеми тремя выравниваниями (рисунок 3):


В выравнивании GLprobs аргинину (ARG 280) сопоставлен пролин (PRO 285) и глутамин (GLN 285).

В выравнивании Mafft аргинину (ARG 282) сопоставлены гепы.

В выравнивании Muscle аргинину (ARG 282) сопоставлен пролин (PRO 285) и аргинин (ARG 287).


Рисунок 3



Сложно сказать, какие из выравниваний выглядят более правдоподобно, потому что очень часто происходит смещение отдельных консервативных блоков друг относительно друга, по причине которого и могут возикать различия. Однако можно заметить, что в выравнивании Muscle полностью отсутствуют концевые гепы. Поскольку консервативность концевых участков белка мало вероятна, то, на мой взгляд, правдоподобнее выглядят выравнивания Mafft и Glprobs.

Кроме того, в выравнивании Mafft гораздо больше инделей, чем в других множественных выравниваниях. Из-за этого происходит смещение аминокислотных остатков, и часто теряются консервативные блоки, которые присутствуют в выравниваниях Muscle и GLprobs. Поэтому в конечном итоге я остановила бы свой выбор на выравнивании GLprobs.


Ориентированный граф для глобального парного выравнивания с афинными штрафами за индели

На рисунке 4 представлена визуализация графа для выравнивания двух последовательностей длиной в 4 аминокислоты.

Рисунок 4

Пояснения к рисунку:

- Движение по диагонали в горизонтальных плоскостях (пример: красный, оранжевый векторы) - сопоставление букв последовательностей друг другу.

- Движение по диагонали в вертикальных плоскостях (пример: синий, желтый векторы) - начальные гепы с более высоким штрафом.

- Движение параллельно ребрам куба в горизонтальных плоскостях (пример: малиновый, салатовый векторы) - гепы, идущие после начального в одном инделе (с менее высоким штрафом).


©Машковская Анна, 2018