Предсказание парных выравниваний


При выполнении этого практикума использовалось множественное выравнивание align_04.fasta.
Результат выполнения заданий представлен в jvp-формате.


После открытия в JalView множественного выравнивания гомологичных последовательностей из предыдущего практикума, я выбрала две наименне схожие последовательности методом главных компонент. (Рис 1).


Трёхмерное координатное пространство
Рис.1 Трёхмерное координатное пространство, полученное с помощью Principal component analysis.


множественное выравнивание
Рис.2 Наиболее удаленные последовательности во множественном выравнивании.


Затем я оставила в выравнивании только две наиболее удаленные последовательности. Идентификаторы этих последовательностей (AC):
  • LACLK

  • ACEAZ

  • После этого я сохранила выбранные последовательности в файлах seq1.fasta и seq2.fasta в формате fasta.


    наиболее удаленные последовательности
    Рис.3 Наиболее удаленные последовательности.


    При помощи программ needle и water, входящих в пакет EMBOSS, который установлен на kodomo, я построила 4 парных выравнивания:

    1. Парное выравнивание выбранных последовательностей, построенное программой needle со стандартными основными дополнительными параметрами: матрица весов замен [BLOSUM62], gap open [= 10], extension [= 0.5].
    Результат: needle.fasta

    2. Парное выравнивание выбранных последовательностей, построенное программой water со стандартными основными дополнительными параметрами: матрица весов замен [BLOSUM62], gap open [= 10], extension [= 0.5].
    Результат: water.fasta

    3. Парное выравнивание выбранных последовательностей, построенное программой needle с измененными основными дополнительными параметрами: матрица весов замен [BLOSUM62], gap open [= 2], extension [= 0.5].
    Результат: needle_1.fasta

    4. Парное выравнивание выбранных последовательностей, построенное программой water с измененными основными дополнительными параметрами: матрица весов замен [BLOSUM62], gap open [= 10], extension [= 0.1].
    Результат: water_1.fasta

    Уменьшение штрафа за открытие гэпа серьезно изменило внешний вид выравнивания: количество гэпов резко увеличилось. Уменьшение штрафа за продолжение гэпа не привнесло значительных изменений.


    При помощи установленного на kodomo пакета EMBOSS были построены парные глобальное и локальное выравнивания заведомо негомологичных белков: F4BY60 и Q8A1A2.
    Выравнивания: nonhomologous_needle.fasta и nonhomologous_water.fasta.


    В 7ом задании я сравнивала парное выравнивание, взятое из множественного с построенным программой needle c уменьшенным штрафом за открытие гэпа (needle_1.fasta), так как выравнивания, полученные с помощью программ needle и water со стандартными параметрами, мало отличаются от исходного.

    Координаты участка различия: 14-21, 29-32, 35-51, 53-...(начиная с 53, потому что с этого момента в выравниваниях появляется большое количество гэпов в разных последовательностях и поэтому колонки начинают отличаться).
    Число различающихся колонок: 52.





    совпадающий участок с начала выравниваний


    совпадающий участок с конца выравниваний

    Выравнивание Длина Процент идентичных колонок Процент колонок со сходными остатками Число гэпов
    Парное выравнивание, полученное из множественного 79 37.97% 12.66% 1
    Глобальное выравнивание (needle) 78 51.28% 24.36% 29
    Локальное выравнивание (water) 53 52.83% 28.3% 8
    Глобальное выравнивание с измененными параметрами (needle_1) 78 51.28% 28.2% 37
    Локальное выравнивание с измененными параметрами (water_1) 56 0.5% 26.76% 20
    Глобальное для негомологичных белков 421 25.89% 13.54% 202
    Локальное для негомологичных белков 86 44.19% 25.58% 22


    Проанализировав полученные данные, можно сделать вывод, что локальные выравнивания лучше глобальных, так как выравнивается только часть последовательности, следовательно порцент консервативных колонок выше.
    Парное выравнивание лучше множественного, так как количество и длина гепов меньше, чем во множественном. Однако множественное выравнивание точнее парного, ведь выборка в нём больше, а значит, если позиция во множественном выранивании консервативна или функционально консервативна, то вероятность случайности этого явления ниже, чем в парном выравнивании.

    СПАСИБО ЗА ПРОСМОТР


    © Мария Медведева