Практикум 12

(*) Реализуйте алгоритм сравнения разных выравниваний одних и тех же последовательностей, описанный в презентации

Данная программа взята из отчёта моей многоуважаемой однокурсницы Александры Угадчиковой.

Сравнение MUSCLE и MAFFT (по выдаче программы)

С помощью программы я подсчитала, что у данных выравниваний 5 блоков совпадений, общее число совпавших колонок - 554. Для выравнивания muscle длина выравнивания – 605, процент совпадений для выравнивания - 91.57; для выравнивания mafft соответственно 608 и 91.12. Примеры блоков совпадений: (1;215)-(1;215), (230;411)-(232;413), (422;539)-(425;542). Примеры блоков несовпадений: (216;229)-(216;231), (412;421)-(414;424).

Сравнение MUSCLE и EMMA (по выдаче программы)

С помощью программы я подсчитала, что у данных выравниваний 8 блоков совпадений, общее число совпавших колонок - 495. Для выравнивания muscle длина выравнивания – 605, процент совпадений для выравнивания – 81.82; для выравнивания emma соответственно 604 и 81.95. Примеры блоков совпадений: (1;219)-(1;219), (339;392)-(338;391), (395;411)-(394;410). Примеры блоков несовпадений: (220;229)-(220;228), (320;338)-(319;337).

По данным, полученным в результате сравнения выравниваний, программа muscle больше похожа на программу mafft, чем на emma. Такой вывод можно сделать, исходя из того, что число совпавших колонок больше у пары mafft и muscle, также у них больший процент совпадений для выравнивания, чем у пары muscle и emma.

Проект Jalview (визуализация трёх выравниваний): msa_compare.jvp

Совпавшие колонки выравниваний muscle и mafft: result_MM.txt

Совпавшие колонки выравниваний muscle и emma: result_M.txt

3. Постройте выравнивание по совмещению структур и сравните его с выравниванием программой MSA

Я выбрала 3 последовательности с доменом Cytochrom_B_C и сравнила их выравнивания, сделанные с помощью PDBeFold и Muscle.

С помощью программы я подсчитала, что у данных выравниваний 4 блока совпадений, общее число совпавших колонок - 423. Для выравнивания muscle длина выравнивания – 446, процент совпадений для выравнивания – 94.84; для выравнивания PDBeFold соответственно 456 и 92.76. Примеры блоков совпадений: (1;212)-(1;212), (237;294)-(228;286), (301;397)-(292;388). Примеры блоков несовпадений: (213;236)-(213;228), (295;300)-(287;291).

Требуемые ссылки:

href="https://kodomo.fbb.msu.ru/~annabulen/term2/muscle64.fasta">MUSCLE alignment
  • PDBeFOLD alignment
  • Проект Jalview: compare.jvp

    Совпавшие колонки выравниваний muscle и PDBeFold: out.txt

    Совмещение структур

    Обсуждение результатов

    По сравнению выравниваний muscle и PDBeFold видно, что эти программы довольно похожи: такой вывод можно сделать, исходя из того, что у их выравниваний довольно большое число совпавших колонок (423/446 для muscle и 423/456 для PDBeFold), также у них больший процент совпадений для выравнивания у обеих программ (более 90%).

    4. Описание программы MUSCLE

    Muscle – алгоритм множественного выравнивания последовательностей. При выравнивании Muscle использует логарифмическое ожидание и итеративное рафинирование, а также прогрессивное выравнивание.

    Преимущества программы: высокая скорость, относительно точное выравнивание, использование итеративного рафинирования, что повышает точность выравнивания.

    Недостатки программы: в начале работы программы при составлении попарных выравниваний может в работу muscle закрасться ошибка. К сожалению, ошибка может потом закрепиться.

    Список литературы

    Edgar RC. MUSCLE: multiple sequence alignment with high accuracy and high throughput. Nucleic Acids Res. 2004;32(5):1792-1797. Published 2004 Mar 19. doi:10.1093/nar/gkh340.