Учебный сайт Ивановой Софьи | |||||
Главная | Первый семестр | Второй семестр | Ссылки | Обо мне | Контакты |
Практикум 9. Предсказание парных выравниваний. | |
Для выполнения заданий было взято множественное выравнивание №08. Файл в виде проекта программы Jalview доступен по ссылке Задание 1. Были выбраны две наименее сходных последовательности из множественного выравнивания. Это было сделано с помощью метода главных компонентов (Principal component analysis), визуализирующей сходство последовательностей в виде графического расстояния между ними. Результаты представлены на рис.1. Были выбраны последовательности TETHN и ROSHA. Их относительно слабое сходство согласуется со степенью родства согласно филогенетическому дереву (рис.2). Рис.1 Результаты Principal component analysis для выравнивания №8. Рис.2 Филогенетическое дерево для выравнивания №8. Задания 2-6. Результаты приведены в прикрепленном файле (проект jalview). Он содержит следующие выравнивания:
Задание 7. Сравнение парных выравниваний:построенного из множественного и построенного программой (needle или water). Программа needle строит глобальное парное выравнивание, water строит локальное парное выравнивание. координаты одного участка различия, число различающихся колонок в каждом из выравниваний, и рисунок, включающий по пять совпадающих колонок двух выравниваний с каждого из концов от участка с различиями сравниваемых выравниваний 1. Needle + исходное выравнивание, полученное из множественного
Рис.3 Выровненные парное выр-е, пол-е с помощью Needle (верхние 2 строки), и исходное выравниванием (нижние 2 строки). Рис.4 Участок различия между в-м, полученным с пом-ю Needle, и исходным выравниванием. Координаты различающегося участка: 40-52. В целом выравнивания различаются слабо. Число различающихся между двумя выравниваниями колонок равно 23. Суммарный процент идентичных (консервативных) и похожих колонок (в качестве характеристики "привлекательности" выравнивания) равен соответственно 51.5% для исходного (полученного из множественного) и 53.8% для полученного с пом-ю Needle.
2. Water + исходное выравнивание, полученное из множественного.
Рис.5 Выровненные парное выр-е, пол-е с помощью Needle (верхние 2 строки), и исходное выравниванием (нижние 2 строки). Рис.6 Участок различия между в-м, полученным с пом-ю Water, и исходным выравниванием. Координаты различающегося участка: 95-141. Число различающихся между двумя выравниваниями колонок равно 62. Суммарный процент идентичных (консервативных) и похожих колонок равен соответственно 51.5% для исходного (1) и 55.5% для полученного с пом-ю Water (2). Довольно длинный концевой участок выравниваний !1) и (2) - 47 аминокислотных остатков - не совпадает(см. рис.6). Выравнивание, построенное с помощью water, отличается от исходного множественного намного существеннее, чем полученное с помощью needle. Задание 8. Комментарии относительно выравниваний, полученных разными способами. 1. Сводная таблица характеристик выравниваний. Подписи к столбцам: SeqLen - длина последовательности, AlignLen - длина выравнивания с гэпами, Gaps - количество гэпов (открытий), GapLen - длина гэпов(кол-во черточек),Ident/Ident % - количество идентичных колонок, Similar/Similar % - количество похожих колонок, Ident + Similar % - сумма процента идент. и похожих колонок, % Change - процент изменений. Для получения численных значений характеристик была использована программа infoalign (пакет EMBOSS). Можно заключить, что парное выравнивание для двух последовательностей дает лучшие результаты (т.е. больший процент сходства, чем множественное), а локальное - лучшие, чем глобальное. Изменения штрафа за открытие и продолжение гэпов приводят к абсурдному увеличению количества гэпов, что в результате может увеличивать количество идентичных колонок, но на найденное суммарное сходство влияет, как мне кажется, нелинейно. |