ПРАКТИКУМ 12

Множественное выравнивание последовательностей белков

Петрова Анастасия

СРАВНЕНИЕ ВЫРАВНИВАНИЯ ОДНИХ И ТЕХ ЖЕ ПОСЛЕДОВАТЕЛЬНОСТЕЙ РАЗНЫМИ ПРОГРАММАМИ MSA

Для анализа взяли выравнивания 5 сенсорных белков контроля аэробного дыхания программами Clustal Omega и MuscleWS. В результате были выделены следующие совпадающие блоки:

Эти блоки примерно соответствуют гомологичным блокам, также стоит заметить, что выравнивания на N-конце различаются значительно больше чем на C-конце.

Проект в Jalview таблица сравнения

ВЫРАВНИВАНИЕ ПО СОВМЕЩЕНИЮ СТРУКТУР

Для выравнивания по совмещению структур использовался инструмент align программы PyMOL. Выравнивались структуры, предсказанные AlphaFold для сенсорных белков контроля аэробного дыхания Escherichia coli штаммов К12 и O157:H7 и Shigella flexneri.

ArcB

Cовмещенные структуры сенсорных белков контроля аэробного дыхания: синий - белок E.coli, штамм К12; зеленый - Shigella flexneri, розовый - E.coli, штамм O157:H7

Несмотря на то, что последовательности различаются всего на одну аминокислоту, расположение N-концевых альфа-спиралей для белка E.coli, штамма O157:H7 немного различается, в остальном вторичные структуры идентичны.

ОПИСАНИЕ ПРОГРАММЫ MUSCLE

MUSCLE - это программа для множественного выравнивания, написанная на C++, принимающая на ввод FASTA-файлы и выводящая файлы FASTA, CLUSTALW, HTML, PHYLIP, MSF. MUSCLE предназначена для быстрого сравнения большого количества последовательностей.

Алгоритм MUSCLE можно разделить на 3 этапа: черновое прогрессивное выравнивание, улучшенное прогрессивное выравнивание и уточение. На стадии чернового выравнивания для каждой пары последовательностей вычисляется расстояние К-меров, их матрица кластеризуется с помощью UPGMA, и получается бинарное дерево, по которому строится выравнивание. На стадии улучшенного выравнивания, выравнивание уточняется, используя расстояния Кимуры, их матрица также кластеризуется, по полученному дереву строится второе выравнивание. На стадии уточнения второе дерево делится на 2 поддерева и строится профиль множественного выравнивания для каждого. Путем выравнивания двух профилей заново, получается новое выравнивание, и если точность его повысилась, то его оставляют, иначе - отбрасывают и повторяют доработку.