Предсказание парных выравниваний

Предсказание парных выравниваний

Задание 1

Выбраны две наименее схожих последовательности ( BUTPB и CELLD ) с помощью функции Principal component analysis.(task_1)

картинка загружается...

Последовательности в координатном пространстве

Задание 2

Оставлены в выравнивании только выровненные последовательности. (task_2)

Задание 3

Сохранены две выбранные последовательности в файлах seq1.fasta и seq2.fasta в формате fasta.

Задание 4

Выровнены последовательности четыре раза и сохранены выравнивание в формате fasta в файлах needle.fasta, water.fasta, needle_1.fasta, water_1.fasta.

В файлах needle и water матрица весов замен, gap open, extension поставлены по умолчанию, а в файле needle_1 gap open = 2.0, в файле water_1 используется матрица BLOSUM30.

При уменьшении штрафа за открытие гэпа количество и размер гэпов увеличились(needle_1).

При замене матрицы с BLOSUM62 на BLOSUM30 единственная вставка из 2х гэпов поменяла свое местоположение(water_1).

Задание 5

Было построено парное выравнивания последовательностей двух заведомо негомологичных белков(nonhomologous_needle и nonhomologous_water).

Задание 6

Открыты все построенные выравнивания в разных окнах JalView и сохранен проект.

Задание 7

Сравнены парные выравнивания: сверху - построенное из множественного; снизу - построенное программой.

С выравниванием, построенным из множественного,сравнены выравнивания needle, needle_1, water, water_1.

1) Сравнение выравнивания, построенного из множественного, и выравнивания needle.

Последовательности выровнены идентично в этих двух выравниваниях.

Файл в формате jar

2) Сравнение выравнивания, построенного из множественного, и выравнивания needle_1.

Координаты 1 участка различия - 54-66

В выравнивании, построенном из множественного, различающихся колонок 8, а в выравнивании needle - 13.

картинка загружается...

Координаты 2 участка различия - 142-145

В выравнивании, построенном из множественного, различающихся колонок 3, а в выравнивании needle_1 - 4.

картинка загружается...

Файл в формате jar

3) Сравнение выравнивания, построенного из множественного, и выравнивания water.

Последовательности выровнены идентично в этих двух выравниваниях.

Файл в формате jar

4) Сравнение выравнивания, построенного из множественного, и выравнивания water_1.

Координаты участка различия - 54-61.

В выравнивании, построенном из множественного, различающихся колонок 8, как и в выравнивании water.

картинка загружается...

Файл в формате jar

Задание 8

Таблица результатов infoalign

Имя Процент идентичных колонок Процент колонок со сходными остатками Суммарная длина гэпов
Needle 76.82% 5.96% 2
Needle_1 78.14% 5.29% 16
Water 76.82% 5.96% 2
Water_1 76.16% 7.28% 2
Nonhomologous_needle 15.47% 13.30% 494
Nonhomologous_water 26.36% 20.90% 136

Комментарии

Можно увидеть, что чем меньше процент идентичных колонок и чем больше гэпов, тем хуже выравнивание. При выравнивании негомологичных последовательностей появляется большое количество гэпов. И Needle и Water c параметрами по умолчанию выровняли последовательнось идентично выравниванию, полученному из множественного (исходного в задании). В Needle_1 увеличено количество гэпов вследствие уменьшение штрафа за открытие гэпа (2.0 вместо 10.0). Поэтому слегка больше процент идентичных колонок. В Water_1 изменение матрицы весов замен на BLOSUM30 привело только к небольшому смещению единственного гэпа длиной 2, что не сказалось на качестве выравнивания. На примере этих последовательностей нельзя однознано сказать, что лучше - локальное или глобальное выравнивание, парное или множественное.

Файл всего проекта в формате jvp