alignments

На главную страницу второго семестра

Программы построения глобального и локального выравнивания

Для начала работы были подготовлены 3 файла:

  1. Выравнивание последовательностей со схожей функцией (возможных гомологов).
    • С помощью программы "needle" было построено глобальное выравнивание последоватеотностей из myprot.fasta и secondprot.fasta, результат которого был сохранен в файле 1to2.needle.
    • С помощью программы "water" было проведено локальное выравнивание тех же последовательностей. Результат его - в программе 1to2.water.
    • Комментарии:
      Обе программы в качестве матрицы аминокислотных замен используют EBLOSUM62 и одинаковые параметры, предложенные по умолчанию: штраф за открытие гэпа - 10.00, штраф за продолжение гэпа - 0.5. При глобальном выравнивании длина выравнивания больше: 207 против 200, но процент идентичности и схожести от этого немного страдает, то есть оказывается меньше, чем при локальном. Таким образом, все результаты получились вполне закономерными, так как глобальное выравнивание - это выравнивание всей последовательности, а при локальном опускаются те части, в которых вес выравнивания отрицателен. Очень сильные различия в количестве гэпов (и соответственно в проценте от размера последовательности) - 6 при глобальном и 1 при локальном - объясняются разной длиной двух белков, так как при глобальном выравнивании "излишки" первой последовательности компенсируются гэпами со стороны другой, более короткой. Исходя из всего этого, очевидно, что количество очков ("Score") локального выравнивания должно быть больше, что мы и наблюдаем на деле.

  2. Выравнивание последовательностей, содержащих общие участки.
    • Из последовательностей myprot.fasta и thirdprot.fasta с помощью программы "needle" было построено глобальное выравнивание: 1to3.needle.
    • Из последовательностей myprot.fasta и thirdprot.fasta с помощью программы "water" было построено локальное выравнивание. Результат - в файле 1to3.water.
    • Результат локального выравнивания последовательностей из myprot.fasta и thirdprot.fasta с выводом трех наилучших вариантов, выполненное с помощью программы matcher можно найти в файле 1to3.matcher.
    • Комментарии:
      Все три программы в качестве матрицы аминокислотных замен используют EBLOSUM62, но параметры, предложенные по умолчанию для программы matcher (штраф за открытие гэпа - 14, штраф за продолжение гэпа - 4), не такие же, как для программ needle и water. Программа matcher строит три лучших выравнивания, в отличие от двух предыдущих программ, которые строят лишь одно выравнивание.
      Как и предполагалось, при глобальном выравнивании получились крайне маленькие значения Identity и Similarity, а процент гэпов соответственно очень высок: 92.4%. Но зато программа выравняла всю последовательность мутанта, что очень удобно, если требуется найти место и возможный сценарий мутации от исходной последовательности (хотя непосредственно в нашем случае второй кусок измененной последовательности из-за веса стоит не на своем месте).
      В локальном выравнивании, как и ожидалось ситуация с процентами идентичности, сходства и содержания гэпов диаметрально противоположная: 92.3%, 92,3% и 0% соответственно. Но все-таки, программа выравняла только часть мутантной последовательности, так как захватить другую часть не представилось возможным из-за значения "веса" выравнивания, которое в таком случае оказалось бы значительно меньше.
      Первое выравнивание (длиной в 13 аминокислот) программы matcher полностью совпало с локальным выравниванием через water - это выравнивание первой части мутантной последовательности, взятой из COAE_ECOLI. Второе выравнивание (самое лучшее по процентам идентичности - 100% - и процентам сходства - 100%; его длина - 10 а.) представляет большей своей частью второй кусок последовательности COAE_ECOLI. Третье же выравнивание - вообще в 4 аминокислоты. Здесь был выровнен только участок из первой половины "склеиваемой" последовательности.

  3. Параметры программ построения выравниваний.
    Результаты глобальные выравнивания последовательностей из myprot.fasta и thirdprot.fasta, выполненные с помощью программы needle при разных значениях параметра штрафа за открытие гэпа:

    Штраф за открытие гэпа

    Штраф за продолжение гэпа

    Файл результатов

    10

    1

    1to3_10_1.needle

    5

    1

    1to3_5_1.needle

    1

    1

    1to3_1_1.needle

    При первом и втором вариантах выравнивания результаты идентичны выравниванию 1to3.needle, так как тут меняется только штраф за продолжение гэпа (с 0.5 на 1), а во втором случае штраф за продолжение меняется относительно немного. В данной ситуации влиять на результат это не может. Но вот в третьем файле происходят сильные отклонения от предыдущих выравниваний. Вторая часть мутантной последовательности, наконец (впервые за все выравнивания, проведенные на данном занятии), становится "на свое место", то есть выравнивается с тем участком, из которого была взята. взят. Но теперь, в свою очередь, первая часть мутантной последовательности съезжает вслед за второй в конец последовательности, откуда и была взята последняя.

  4. Карта локального сходства.
    С помощью программы dotmatcher была построена карта локального сходства по последовательностям из myprot.fasta и thirdprot.fasta:


    Программа dotmatcher представляет результаты выравнивания в виде графика, в котором по осям откладываются выравниваемые аминокислотные последовательности. Области совпадений представляются в виде линий. На данном рисунке мы видим две диагональные линии, которые соответствуют выравниванию двух частей мутанта, взятых из разных участков последовательности белка COAE_ECOLI. Такая графическая визуализация всего выравнивания очень удобна, но только когда требуется его общая картина.
    Программа обладает двумя параметрами, которые можно менять: windowsize, и threshold. Вначале я изменял второй параметр. По умолчанию нам дано, что он равен 23. При 15 появляется несколько новых линий. И вообще при уменьшении параметра threshold количество линий, то есть участков выравнивания, возрастает. Так, при threshold=4 у меня получилась картина сплошь заштрихованная диагональными линиями во весь график. И наоборот, при сильном увеличении данного параметра, например до 50, линии исчезают вовсе. Отсюда логично предположить, что threshold определяет порог выравнивания по его весу, или, другими словами, минимальный вес выравнивания, который позволяет ему отображатся на карте.
    Параметр windowsize по умолчанию равен 10. При увеличении его линии выравнивания удлиняются. При уменьшении - наоборот, то есть становятся короче. И, что интересно, если увеличивать данный параметр при threshold=50 (когда линий не наблюдается), то можно добиться постепенного появления этих линий (такое наблюдается уже при windowsize=25). Таким образом, можно прийти к заключению, что windowsize определяет длину выравниваемого участка, что влияет на вес и следовательно на параметр threshold.



©Куликовский, Алексей