Практикум 12.

1. Сравнение выравнивания одних и тех же последовательностей разными программами.

Программы для сравнения: MUSCLE и Clustal
Взяты последовательности full из семейства PF00509: PF00509.fasta
Выравниевание с помощью MUSCLE: align_MUSCLE.jvp
Выравнивание с помощью Clustal: align_Clustal.jvp
Итоги сравнения двух выравниваний с помощью программы (здесь показаны номера одинаково выравненных колонок):
align_compare.csv
Доля одинаково выравненных позиций в выравнивании MUSCLE (alig1):
0.66%
Доля одинаково выравненных позиций в выравнивании Clustal (alig2):
0.67%
В качестве краткого вывода можно сказать, что алгоритмы одинаково эффективны. Однако мне показалось, что Clustal потратил на выравнивание больше времени.

2. Выравнивание по совмещению структур

Были выбраны белки:
UniProt ID:
A0A024CX39_9INFA - 6II8 (PDB ID) - зелёный
A0A024E2M1_9INFA - 4R8W - голубой
A0A059T4A1_9INFA - 4XQO - розовый
all.png
Выравнивания 4XQO и 6II8 считаю удачными, что нельзя сказать о 4R8W.
Вдобавок, это подтверждается и выравниванием с помощью MUSCLE: align_3D.jvp

3. Краткое описание работы MUSCLE

MUSCLE - Multiple Sequence Comparison by Log-Expectation
Может проводить выравнивание последовательностей аминокислот белков и нуклеотидов
Алгоритм:
1. Draft progressive - Скоростное 'черновое'(не обладает высокой точностью) выравнивание. Создаются графы-деревья.
2. Improved Progressive - Выбирается наиболее подходящее дерево и на его основе строится второе дерево.
3. Refinement - выбирается ребро из второго дерева, причем посещаемые ребра находятся на уменьшающемся расстоянии от корня. Это ребро удаляется, получаются поддеревья, по которым строятся выравнивания. После чего эти выравнивания выравнивают относительно друг друга. Третья стадия идёт пока не будет достигнута нужная точность, заданная пользователем.

Алгоритм MUSCLE обладает хорошей скоростью и точностью, поэтому используется довольно часто.

Назад

P.S. Очень хочется выразить благодарность Лизе Плешко, написавшей программу по сравнению двух выравниваний.