Учебный сайт Ивановой Софьи

Главная Первый семестр Второй семестр Ссылки Обо мне Контакты

Практикум 9. Предсказание парных выравниваний.

Для выполнения заданий было взято множественное выравнивание №08.

Файл в виде проекта программы Jalview доступен по ссылке

Задание 1.

Были выбраны две наименее сходных последовательности из множественного выравнивания. Это было сделано с помощью метода главных компонентов (Principal component analysis), визуализирующей сходство последовательностей в виде графического расстояния между ними. Результаты представлены на рис.1. Были выбраны последовательности TETHN и ROSHA. Их относительно слабое сходство согласуется со степенью родства согласно филогенетическому дереву (рис.2).

Рис.1 Результаты Principal component analysis для выравнивания №8.

Рис.2 Филогенетическое дерево для выравнивания №8.

Задания 2-6.

Результаты приведены в прикрепленном файле (проект jalview). Он содержит следующие выравнивания:

  • с исходным множественным выравниванием
  • выравниванием, полученным удалением лишних последовательностей из данного множественного;
  • с парным выравниванием выбранных последовательностей, построенным программой needle;
  • то же, но с использованием программы water;
  • то же, но с измененными параметрами программы needle (был изменен штраф за открытие гэпа - стал 5 единиц);
  • то же, но с измененными параметрами программы water (был изменен штраф за продолжение гэпа - стал 3 единицы);
  • с глобальным парным выравниванием последовательностей заведомо не гомологичных белков ( идентификаторы ASSY_PICTO и G2Z3N7_FLABF);
  • с локальным парным выравниванием заведомо негомологичных белков.

Задание 7. Сравнение парных выравниваний:построенного из множественного и построенного программой (needle или water).

Программа needle строит глобальное парное выравнивание, water строит локальное парное выравнивание. координаты одного участка различия, число различающихся колонок в каждом из выравниваний, и рисунок, включающий по пять совпадающих колонок двух выравниваний с каждого из концов от участка с различиями сравниваемых выравниваний

1. Needle + исходное выравнивание, полученное из множественного



Рис.3 Выровненные парное выр-е, пол-е с помощью Needle (верхние 2 строки), и исходное выравниванием (нижние 2 строки).




Рис.4 Участок различия между в-м, полученным с пом-ю Needle, и исходным выравниванием. Координаты различающегося участка: 40-52.

В целом выравнивания различаются слабо. Число различающихся между двумя выравниваниями колонок равно 23. Суммарный процент идентичных (консервативных) и похожих колонок (в качестве характеристики "привлекательности" выравнивания) равен соответственно 51.5% для исходного (полученного из множественного) и 53.8% для полученного с пом-ю Needle.



2. Water + исходное выравнивание, полученное из множественного.



Рис.5 Выровненные парное выр-е, пол-е с помощью Needle (верхние 2 строки), и исходное выравниванием (нижние 2 строки).




Рис.6 Участок различия между в-м, полученным с пом-ю Water, и исходным выравниванием. Координаты различающегося участка: 95-141.

Число различающихся между двумя выравниваниями колонок равно 62. Суммарный процент идентичных (консервативных) и похожих колонок равен соответственно 51.5% для исходного (1) и 55.5% для полученного с пом-ю Water (2). Довольно длинный концевой участок выравниваний !1) и (2) - 47 аминокислотных остатков - не совпадает(см. рис.6). Выравнивание, построенное с помощью water, отличается от исходного множественного намного существеннее, чем полученное с помощью needle.




Задание 8. Комментарии относительно выравниваний, полученных разными способами.


1. Сводная таблица характеристик выравниваний.



Подписи к столбцам: SeqLen - длина последовательности, AlignLen - длина выравнивания с гэпами, Gaps - количество гэпов (открытий), GapLen - длина гэпов(кол-во черточек),Ident/Ident % - количество идентичных колонок, Similar/Similar % - количество похожих колонок, Ident + Similar % - сумма процента идент. и похожих колонок, % Change - процент изменений.

Для получения численных значений характеристик была использована программа infoalign (пакет EMBOSS).

Можно заключить, что парное выравнивание для двух последовательностей дает лучшие результаты (т.е. больший процент сходства, чем множественное), а локальное - лучшие, чем глобальное.

Изменения штрафа за открытие и продолжение гэпов приводят к абсурдному увеличению количества гэпов, что в результате может увеличивать количество идентичных колонок, но на найденное суммарное сходство влияет, как мне кажется, нелинейно.


© Иванова Софья