Практикум 12

1. Алгоритм сравнения программ выравнивания

Для сравнения программ был использован код Ксении Кирцовой.

  • Ссылка на код
  • 2. Сравнение программ выравниваний

    Сравнивались программы Mafft (взята как референсная ), Clustal Omega и Kalign. Запуск программ осуществлялся с помощью сайта EMBL-EBI. Выравнивание строилось для белков из 4 пункта 9 практикума.

  • Выравнивания в Jalview
  • Табл.1 Сравнение программ выравнивания
    ”Сравнение1”

    Выравнивания программой Mafft и Сlustl Omega имеют много совпадающих блоков небольшой длины. Самым крупным оказался блок 7 с длинной 29. Так же была найдена одна совпадающая колонка (координаты:129;130). Общая длинна совпадающих блоков: 45% от длины референсного выравнивания.

    Выравнивания программой Mafft и Kalign имеют меньше идентичных блоков, но с большей длиной: так у блока 4 длина 112. Длинна совпадающих блоков относительно длинны референсного выравнивания: 69%

    Наиболее схожими оказались выравнивания программ Mafft и Kalign.

    3. Построение выравниваний по совмещению структур


    Для исследования было выбрано 3 белка из семейства RapH_N (Id pfam) со следующими PDB ID: 4i9e, 3ulq, 6t3h.
    В качестве референсного был использован белок 4i9e

  • Выравнивание на cайте PDB
  • ”результат_3d_выравнивания”
    рис.1 Результат выравнивания по совмещению структур
    ”3d_выравнивание”
    рис.2 Совмещение структур

    Вырвнивание, построенное на основе совмещения структур, показывает почти полную идентичность белка 4i9e и 6t3h (у второго белка отсутсвует начальный участок). При этом пространсвенная структура доменов совпала у всех белков.

    Для удобства работы, два выравнивания с PDB были объединены в одно, а так же, для сравнения, было сделано выравнивание этих белков в Mafft.

  • Изначальное выравнивание с PDB, объединенное выравнивание PDB и выравнивание Mafft в Jalview
  • Табл.2 Результат сравнения выравниваний
    ”результат_сравнения_выравниваний”

    Сравнение результатов выравниваний с помощью программы из п.1 показывает наличие крупных совпадающих блоков и относительно небольших несовпадающих. В целом, судя по совмещению пространственных структур и результатам выравниваний, можно сделать вывод о гомологичности выбранных белков.

    Описание программы Mafft

    Mafft (от multiple alignment using fast fourier transform) — программа множественного выравнивания на основе прогрессивного алгоритма, созданная в 2002 году.

    Процесс работы программы состоит из 5 шагов:
    1. Попарное выравнивание: строится для всех пар последовательностей.
    2. Матрица расстояний.
    3. Направляющее дерево: строится на основе матрицы расстояний, ближайшие последовательности образуют кластеры (листья), ветви - расстояния между кластерами.
    4. Прогрессивное выравнивание: выравнивание последовательностей от листьев к корню.
    5. Итеративное выравнивание: выравнивание разделяется на две группы и перевыравнивается. Процесс продолжается пока не достигнется наилучшее выравнивание.

    Особенностью Mafft является использование особого алгоритма для быстрого подсчета матрицы расстояний: 20 аминокислот группируются в 6 групп на основе физико-химических свойств и на основе этого алфавита строится быстрое дерево. После этого строится второе прогрессивного выравнивание с использованием полного алфавита, после чего программа переходит к итеративному выравниванию.

    Источники:

  • Статья PubMed
  • Статья ResearchGate