Предсказание парных выравниваний
Задание 1
Задание 1
Выбраны две наименее схожих последовательности ( BUTPB и CELLD ) с помощью функции Principal component analysis.(task_1)
Последовательности в координатном пространстве
Задание 2
Оставлены в выравнивании только выровненные последовательности. (task_2)
Задание 3
Сохранены две выбранные последовательности в файлах seq1.fasta и seq2.fasta в формате fasta.
Задание 4
Выровнены последовательности четыре раза и сохранены выравнивание в формате fasta в файлах needle.fasta, water.fasta, needle_1.fasta, water_1.fasta.
В файлах needle и water матрица весов замен, gap open, extension поставлены по умолчанию, а в файле needle_1 gap open = 2.0, в файле water_1 используется матрица BLOSUM30.
При уменьшении штрафа за открытие гэпа количество и размер гэпов увеличились(needle_1).
При замене матрицы с BLOSUM62 на BLOSUM30 единственная вставка из 2х гэпов поменяла свое местоположение(water_1).
Задание 5
Было построено парное выравнивания последовательностей двух заведомо негомологичных белков(nonhomologous_needle и nonhomologous_water).
Задание 6
Открыты все построенные выравнивания в разных окнах JalView и сохранен проект.
Задание 7
Сравнены парные выравнивания: сверху - построенное из множественного; снизу - построенное программой.
С выравниванием, построенным из множественного,сравнены выравнивания needle, needle_1, water, water_1.
1) Сравнение выравнивания, построенного из множественного, и выравнивания needle.
Последовательности выровнены идентично в этих двух выравниваниях.
2) Сравнение выравнивания, построенного из множественного, и выравнивания needle_1.
Координаты 1 участка различия - 54-66
В выравнивании, построенном из множественного, различающихся колонок 8, а в выравнивании needle - 13.
Координаты 2 участка различия - 142-145
В выравнивании, построенном из множественного, различающихся колонок 3, а в выравнивании needle_1 - 4.
3) Сравнение выравнивания, построенного из множественного, и выравнивания water.
Последовательности выровнены идентично в этих двух выравниваниях.
4) Сравнение выравнивания, построенного из множественного, и выравнивания water_1.
Координаты участка различия - 54-61.
В выравнивании, построенном из множественного, различающихся колонок 8, как и в выравнивании water.
Задание 8
Таблица результатов infoalign
Имя | Процент идентичных колонок | Процент колонок со сходными остатками | Суммарная длина гэпов |
Needle | 76.82% | 5.96% | 2 |
Needle_1 | 78.14% | 5.29% | 16 |
Water | 76.82% | 5.96% | 2 |
Water_1 | 76.16% | 7.28% | 2 |
Nonhomologous_needle | 15.47% | 13.30% | 494 |
Nonhomologous_water | 26.36% | 20.90% | 136 |
Комментарии
Можно увидеть, что чем меньше процент идентичных колонок и чем больше гэпов, тем хуже выравнивание. При выравнивании негомологичных последовательностей появляется большое количество гэпов. И Needle и Water c параметрами по умолчанию выровняли последовательнось идентично выравниванию, полученному из множественного (исходного в задании). В Needle_1 увеличено количество гэпов вследствие уменьшение штрафа за открытие гэпа (2.0 вместо 10.0). Поэтому слегка больше процент идентичных колонок. В Water_1 изменение матрицы весов замен на BLOSUM30 привело только к небольшому смещению единственного гэпа длиной 2, что не сказалось на качестве выравнивания. На примере этих последовательностей нельзя однознано сказать, что лучше - локальное или глобальное выравнивание, парное или множественное.