Практикум 13

В этом практикуме были изучены различные программы выравнивания последовательностей белков.

Сравние выравнивания одних и тех же последовательностей разными программами

В качестве последовательностей для выравнивания были выбраны последовательности из домена Nfu_N AC:PF12906 из практикума 11.

Программы с помощью которых были выполнены выравнивания: Mafft; Muscle; T-coffee.

Проект Jalview: Jalview
Fasta файлы: Mafft; Muscle; T-coffee

Таблица 1. Сравнение выравниваний
Mafft и Muscle Mafft и T-coffee
Одинаково выровненные блоки (1,4)-(1,4)
(12,13)-(12,13)
(26,29)-(29,32)
(35,48)-(38,51)
(59,63)-(62,66)
(1,5)-(1,5)
(12,13)-(12,13)
(21,48)-(23,50)
(57,63)-(59,65)
Одинаково выровненные колоноки вне блока (15)-(15)
(32)-(35)
(15)-(15)

Для поиска выровненых колонок была использованна программа Macho.py, сделанная моими однокурсниками.

По таблице 1 видно, что программы Mafft и T-coffee имеют больший процент совпадения блоков чем Mafft и Muscle. Возможно это связано со схожестью алгоритмов составления множественных выравниваний программ Mafft и T-coffee

Совмещение структур и сравнение с программой MSA

Для совмещения структур были выбранны белки 2m6m, 2d8s, 1vyx из домена Nfu_N AC:PF12906 из практикума 11.

Проект Jalview: Jalview

Рисунок 1. Визуальное выравнивание структур белков
Таблица 2. Сравнение выравниваний
Mafft и PDB
Одинаково выровненные блоки (1,2)-(4,5)
(21,30)-(26,35)
(37,59)-(43,65)
(63,68)-(69,74)
(74,78)-(79,83)
(87,93)-(92,98)
Одинаково выровненные колоноки вне блока Нет

Для поиска выровненых колонок была использованна программа Macho.py, сделанная моими однокурсниками.

Как видно из таблицы 2 и русунка 1, выравнивание по третичной структуре тоже не идеально, и не всегда соответ истинному выравниванию (особенно на участках без спиралей и бета-листов).

Программой MSA

Mafft - это высокоэффективная программа для множественного выравнивания биологических последовательностей (ДНК, РНК, белков).

Благодаря использованию FFT-преобразования (аминокислотные остатки заменяются значениями их объемов и полярностей), программа выполняет выравнивание с высокой скоростью, не теряя точности выравнивания.

Алгоритм начинается с попарного выравнивания всех последовательностей, создавая матрицу расстояний, которая отражает степень их различия. Эта матрица служит основой для построения направляющего дерева. Далее используется прогресивное выравнивание. Процесс выравнивания начинается с ближайших пар (листьев дерева) и постепенно объединяет их в более крупные группы, продвигаясь к корню. На каждом шаге последовательности выравниваются относительно уже сформированных групп, что позволяет шаг за шагом построить общее множественное выравнивание. После завершения составления множественного выравнивания алгоритм выполняет итеративное уточнение. Этот шаг необходим для исправления неточностей, которые возникают из-за накопления гэпов в процессе объединения последовательностей.

Mafft является одной из самых популярных программ для множественных выравниваний, потому что сохраняет баланс между скоростью и точностью.