Практикум №12

Выравнивание помощью MAFFT и Clustal Omega.

Задание делал для белков из семейства PF00664 (seed)
Результат выравниваний:
MAFFT
Clustal Omega
Далеее я использовал программу Лизы Плешко для сравнения выравниваний, ссылка на результат программы. Программа нашла 25 полностью одинаковых столбцов, что составляет 6% от количества столбцов в выравнивании MAFFT и 6,3% в выравнивании Clustal Omega.

Выравнивание по совмещению структур

Выравнивание было сделано для семейства белков с ID PF06321. Для анализа выбраны белки с PDB ID: 3LIU, 4JG5, 3UP6. В PDB произвел парное выравнивание 3LIU с 3UP6, затем 3LIU с 4JG5

3LIU с 3UP6
3LIU и 4JG5
Также построил попарные и общее выравнивание и визуализировал в Jalview (ссылка). В верхних окнах попарное, в нижнем - выранивание для 3 последовательностей. Видно, что выравнивание трех последовательностей MSA значительно лучше, чем выравнивание по совмещению структур (видно по окраске Clustal). Также выравнивание по совмещению структур 3LIU с 4JG5 если судить по рисунку получилось лучше, чем 3LIU с 3UP6, однако по выравниваниям в Jalview подтвердить это затруднительно.

Описание программы Muscle

MUSCLE (MUltiple Sequence Comparison by Log-Expectation) - это программа, позволяющая выравнивать белковые и нуклеотидные последовательности. Она осуществляет это в три этапа: предварительный прогрессивный (Draft Progressive), улучшенный прогрессивный (Improved Progressive) и уточнение (Refinement). На первом этапе алгоритм создает множественное выравнивание, пренебрегая точностью в пользу скорости. Сначала просчитывается k-мерная дистанция для каждой пары выравниваний для создания матрицы дистанций, которая затем переводится в бинарное дерево. Для создания профилей каждого "листа" этого дерева в каждом узле осуществляется попарное выравнивание. На втором этапе получается более оптимальное дерево с помощью дистанции Кимуры и последующего повторения действий первого этапа. На последнем этапе происходит деление полученного дерева на суб деревья, которые заново выравниваются и длятся до тех пор, пока наилучшие множественные выравнивания не будут получены.