Предсказание парных выравниваний


Задание 1


Для выполнения задания было выбрано множественное выравнивание последовательностей из файла align_07.fasta
Выравнивание негомологичных последовательностей

Рисунок 1. Множественное выранивание последовательностей

Далее были выбраны 2 наименее схожие последовательности с помощью Principal component analysis по наибольшему расстоянию между точками, соответствующими данным последовательностям: EUBR3 и ENTFO.
Для проверки данного выбора мной также было построено дерево множественного выравнивания, позволяющее наглядно оценить гомологию данных последовательностей.
Дерево подтверждает низкую степень гомологии данных последовательностей

Рисунок 2. Дерево

Задание 2

В выравнивании исходном после удаления других последовательностей и пустых колонок остались только выбранные последовательности.
Выравнивание негомологичных последовательностей

Рисунок 3.Парное выравнивание выбранных последовательностей
Файл в формате fasta: здесь

Задание 3

Выбранные последовательности были сохранены в файлах seq1.fasta и seq2.fasta

Задание 4


В этом задании я использовала программы needle и water.
Программа needle строит глобальное выравнивание 2 последовательностей, подразумевая, что они гомологичны по всей длине.
В глобальное выравнивание входят обе последовательности целиком. Файл в fasta формате:needle
Выравнивание негомологичных последовательностей

Рисунок 4. Парное глобальное выравнивание последовательностей EUBR3 и ENTFO, полученное с помощью программы needle с параметрами gap open = 10.0, gap extension = 0.5, раскраска ClustalX.

Далее я снова использовала needle, но теперь изменила дополнительный параметр – gapeopen (штраф за открытие гэпа).
По умолчанию значение данного параметра равно 10, я уменьшила его до 1 и снова построила выравнивание. Файл в формате fasta: needle_1
Так как штраф за открытие гэпа был значительно уменьшен, то в полученном выравнивании гэпов больше, следовательно, и число консервативных позиций, что наглядно видно, значительно превосходит таковое в выравнивании, представленном на Рис. 4.
Выравнивание негомологичных последовательностей

Рисунок 5. Парное глобальное выравнивание последовательностей EUBR3 и ENTFO, полученное с помощью программы needle с параметрами gap open = 1.0, gap extension = 0.5, раскраска ClustalX.


Программа water строит локальное выравнивание. Здесь считается, что в последовательностях есть как гомологичные, так и негомологичные участки.
Результат локального выравнивания – выбор участка в каждой из последовательностей и выравнивание происходит между этими участками . Файл в fasta формате: water
Выравнивание негомологичных последовательностей

Рисунок 6. Парное локальное выравнивание последовательностей EUBR3 и ENTFO, полученное с помощью программы water с параметрами gap open = 10.0, gap extension = 0.5, раскраска ClustalX.

Аналогично используя water, но поменяв теперь параметр gapextend (штраф за ширину гэпа) со значения, стоящего по умолчанию (0,5) до максимально возможного (10), получила выравнивание, представленное на Рис. 7.
Файл в формате fasta:water_1
Так как штраф за ширину гэпа значительно увеличился, выбранные water гомологичные участки данных 2 последовательностей значительно короче, чем при стандартном значении gapextend (0,5).
Соответственно, и консервативных позиций в данном выравнивании существенно меньше, чем в локальном выравнивании, построенном при стандартном штрафе (Рис. 5).
Выравнивание негомологичных последовательностей

Рисунок 7. Парное локальное выравнивание последовательностей EUBR3 и ENTFO, полученное с помощью программы water с параметрами gap open = 10.0, gap extension = 10.0 раскраска ClustalX.

Задание 5


Были негомологичные последовательности 2 белков: аденозилметионин-8-амино-7-оксононаноат аминотрансферазы из организма Denitrovibrio acetiphilus DSM 12809 и D-аланил-D-аланин карбоксипептидазы из организма Nostoc sp., штамм PCC 7524.
C помощью программ needle и water были построены глобальное и локальное выравнивания данных последовательностей (Рис. 8. и Рис. 9.). Fasta файлы: nonhomo_needle и nonhomo_water соответственно.
Выравнивание негомологичных последовательностей

Рисунок 8. Фрагмент парного глобального выравнивания последовательностей, полученного с помощью программы needle с параметрами gap open = 10.0, gap extension = 0.5 раскраска ClustalX.
Выравнивание негомологичных последовательностей

Рисунок 9. Фрагмент парного локального выравнивания последовательностей, полученного с помощью программы water с параметрами gap open = 10.0, gap extension = 0.5 раскраска ClustalX.

Взятые последовательности заведомо негомологичны. Предпочтительнее в данном случае использовать глобальное выравнивание (needle), так как оно точнее отражает этот факт.

Задание 6


Проект можно скачать по ссылке

Задание 7


Мной были сравнены глобальное выравнивание, полученное с помощью программы needle (сверху), с парным выравниванием, полученным из исходного множественного выравнивания (снизу).
Выровняны друг относительно друга вручную
Выравнивание негомологичных последовательностей

Рисунок 10. Фрагмент выравнивания негомологичных последовательностей

Координаты одного из участков различия: позиции с 20 по 39 (Рис. 11).

Рисунок 11 Наиболее длинный участок различия двух парных выравниваний
Различающихся колонок в выравнивании: 30 (таких колонок, в которых остатки, входящие в колонку одного выравнивания, не совпадают с остатками, входящими в соответствующую колонку второго выравнивания).


Рисунок 12, включающий по пять совпадающих колонок двух выравниваний с каждого из концов от участка с различиями сравниваемых выравниваний.

Задание 8


В таблице 1 представлены данные о числе и проценте консервативных колонок, колонок со сходными аминокислотными остатками, о количестве гэпов в построенных глобальных и локальных выравниваниях гомологичных и немогологичных последовательностей, а также в выравнивании, полученном из множественного.
Таблица 1. Численные параметры (число и процент консервативных колонок и колонок со сходными остатками, количество гэпов) для различных выравниваний последовательностей EUBR3 и ENTFO и негомологичных последовательностей.
Выравнивание Длина выравнивания Число и процент консервативных колонок Число и процент колонок со сходными остатками Число гэпов
Полученное из множественного 160 36 (24,66%) 33 (22,6%) 6
Глобальное для EUBR3 и ENTFO 164 41 (26,8%) 34 (22,22%) 9
Локальное для EUBR3 и ENTFO 159 52 (35,14%) 33 (22,3%) 9
Глобальное, с измененными параметрами 190 95 (62,09%) 28 (18,3%) 45
Локальное, с измененными параметрами 91 28 (32,18%) 25 (16,82%) 3
Глобальное для негомологичных последовательностей 677 72 (10,64%) 40 (28,74%) 11
Локальное для негомологичных последовательностей 168 39 (27,46%) 22 (15,49%) 10
Множественное выравнивание, на мой взгляд, точнее парного, так как выборка больше, а значит если позиция во множественном выранивании консервативна или функционально консервативна, то вероятность случайности ниже, чем в парном выравнивании. Локальное выравнивание выглядит лучше глобального, однако, негомологичность заведомо негомологичных последовательностей точнее отражает глобальное выравнивание, что видно из таблицы.

© Козлова Анастасия, 2014/2015