Учебный сайт Ксении Худяковой

Главная > Семестры > Семестр 2 > Практикум 9

Практикум посвящён парным выравниваниям. Основная работа выполнялась в программе Jalview, вот проект. Для создания первого варианта парного выравнивания нужно из множественного выравнивания из прошлого практикума удалить все последовательности, кроме двух наиболее далёких. Определение наиболее далёких последовательностей было сделано методом Principal component analysis, наиболее далёкими оказались последовательности c идентификаторами ROSHA и DESOD. Для получения ещё двух вариантов выравниваний я запустила программу needle и программу water, используя разные параметры, получив таким образом четыре выравнивания. Программу needle я запустила со стандартными параметрами, а во второй раз с пониженным до 5.0 штрафом за открытие гэпа. Запуск программы water осуществлялся в первый раз с дефолтными парематрами, во второй - с пониженным до 5.0 штрафом за открытие гэпа и до 0.0 за продолжение. Сравнение запусков представлено на рис.1 и рис.2.

Рис. 1. Фрагменты глобального парного выравнивания, построенного программой needle: правый - со стандартными параметрами, левый - с пониженным штрафом за открытие гэпа.

Для того, чтобы добиться изменений в локальном выравнивании (программа water), пришлось сильно понизить штраф за открытие гэпа, а также штраф за его продолжение. При изменении только штрафа за продолжение гэпа выравнивание не менялось.

Рис. 2. Фрагменты локального парного выравнивания, построенного программой water: справа - со стандартными параметрами, слева - с пониженными штрафами за открытие и продолжение гэпа.

Для выравнивания негомологичных белков был выбран мой белок (цистеиновая десульфараза археи, YP_004071041) и белок другого студента (альдолаза бактерии, YP_001041787). Последовательности не гомологичны друг другу, поэтому выравнивание плохое.

Задание 7: Сравнение выравниваний, полученных разными способами

Чтобы привести выравнивания к сравнимому виду, нужно было добавить 5 гепов в позиции 86 выравнивания,полученного из множественного (т.е. нижнего на рис.3). Сравнение глобального выравнивания (needle) с измененными параметрами и выравнивания, полученного из множественного, показало следующее: получился только один участок различия с координатами 77-86 позиции. Остальные колонки двух выравниваний одинаковы. Таким образом, различающихся колонок 15. Участки рядом с участком различия представлены на рис.3.

Рис. 3. Фрагмент сравнения глобального выравнивания (2 верхние строки) и выравнивания, полученного из множественного (2 нижние строки). Красным выделен участок различия (77-86 позиции). С обеих сторон от них стобцы, в которых нет различий.

Задание 8: Комментарии и выводы о парных выравниваниях

Для анализа парных выравниваний с разными параметрами и разной гомологичностью последовательностей полученные c помощью программы infoalign данные по выравниваниям, построенным в предыдущих заданиях, были сведены в Таблицу 1.

Таблица 1. Данные по парным выравниваниям

Выравнивание, полученное из множественного и глобальное выравнивание не отличаются друг от друга, а локальное выравнивание лучше их. Процент совпадений в локальном выравнивании выше, потому что алгоритм удаляет плохие сайты (длина выравнивания меньше). Ожидается, что выравнивания с пониженными штрафами будут лучше, потому что новые гепы помогут найти новые консервативные блоки, но в случае с локальными выравиванием получилось наоборот. Выравнивание негомологичных белков, разумеется, сильно хуже. И отчётливее видна разница между глобальным и локальным выравниями: локальное гораздо лучше находит консервативные участки.