◊ Сравнение множественных выравниваний
► Для данного задания были выбраны белки FOLD_CHLAA, FOLD_ECOLI и FOLD_HELPY из банка данных Uniprot. При построении выравниваний были использованы следующие программы Jalview: Muscle, Mafft и GLprobs. Выравнивания Glprobs-Mafft-Muscle соответственно.
При сравнении выравниваний было обнаружено много существенных различий, далее будут рассмотрены лишь три из них.
1) Колонка №1
Различия появляются уже в первой колонке выравнивания:
В выравнивании Muscle в первой колонке стоит три метионина, в то время как в выравниваниях Mafft и GLprobs метионин (Met 1) третьей последовательности сопоставлен гепам в первой и второй последовательностях. (Рисунок 1)
В общем случае можно утвержать, что в программах Mafft и GLprobs предпочтение отдается концевым гепам.
Рисунок 1
2) Колонка №67
В колонке 67 видна разница между выравниванием Mafft и двумя другими выравниваниями.
В выравниях GLprobs и Мuscle в последовательности FOLD_HELPY в колонке 67 стоит аспартат (Asp 67), а в последовательности, выравненной Mafft, на этом месте стоит геп.(Рисунок 2)
Стоит заметить, что до этого момента выравнивания Mafft и GLprobs практически совпадали, теперь же начинают появляться различия между всеми тремя выравниваниями.
Рисунок 2
3) Колонка №288
В колонке 288 проявляется разница между всеми тремя выравниваниями (рисунок 3):
В выравнивании GLprobs аргинину (ARG 280) сопоставлен пролин (PRO 285) и глутамин (GLN 285).
В выравнивании Mafft аргинину (ARG 282) сопоставлены гепы.
В выравнивании Muscle аргинину (ARG 282) сопоставлен пролин (PRO 285) и аргинин (ARG 287).
Рисунок 3
Сложно сказать, какие из выравниваний выглядят более правдоподобно, потому что очень часто происходит смещение отдельных консервативных блоков друг относительно друга, по причине которого и могут возикать различия. Однако можно заметить, что в выравнивании Muscle полностью отсутствуют концевые гепы. Поскольку консервативность концевых участков белка мало вероятна, то, на мой взгляд, правдоподобнее выглядят выравнивания Mafft и Glprobs.
Кроме того, в выравнивании Mafft гораздо больше инделей, чем в других множественных выравниваниях. Из-за этого происходит смещение аминокислотных остатков, и часто теряются консервативные блоки, которые присутствуют в выравниваниях Muscle и GLprobs. Поэтому в конечном итоге я остановила бы свой выбор на выравнивании GLprobs.
◊ Ориентированный граф для глобального парного выравнивания с афинными штрафами за индели
На рисунке 4 представлена визуализация графа для выравнивания двух последовательностей длиной в 4 аминокислоты.
Рисунок 4
Пояснения к рисунку:
- Движение по диагонали в горизонтальных плоскостях (пример: красный, оранжевый векторы) - сопоставление букв последовательностей друг другу.
- Движение по диагонали в вертикальных плоскостях (пример: синий, желтый векторы) - начальные гепы с более высоким штрафом.
- Движение параллельно ребрам куба в горизонтальных плоскостях (пример: малиновый, салатовый векторы) - гепы, идущие после начального в одном инделе (с менее высоким штрафом).
©Машковская Анна, 2018