Семестры Сайт ФББ МГУ Kodomo Wiki NCBI |
RanHummer personal web-siteПредсказание парных выравниванийДля выполнения заданий данного практикума было взято множественное выравнивание последовательностей из файла align_03.fasta, затем оно было выровнено в соответствии с эволюционным родством последовательностей (с помощью построения дерева эволюционных взаимосвязей по способу Neighbour Joining Using BLOSUM62) и раскрашено по способу BLOSUM62 с порогом консервативности 30 (Рис. 1). Все изображения выравниваний были получены с помощью программы Jalview. С проектом в формате .jvp можно ознакомиться здесь. Рис. 1. Изображение исходного множественного выравнивания последовательностей из файла align_03.fasta. Раскраска BLOSUM62.Задание 1.Была произведена попытка решить задачу - выбор двух наименее схожих последовательностей - смешением двух способов: сначала с помощью метода главных компонент (Рис. 2a) (Calculate -> Principal component analysis) найти наиболее удаленные последовательности, а затем проверить и уточнить догадку на эволюционном дереве (Рис. 2b). Рис. 2a. Результат работы метода главных компонент с множественным выравниванием из файла align_03.fastaРис. 2b. Дерево родства последовательностей из файла align_03.fastaКак наглядно видно на Рис. 2a, наиболее удалены друг от друга 2 пары последовательностей: BUTPB с CELLD и BREBN. На древе эти пары предсказуемо занимают самые удаленные друг от друга позиции. Однако BUTPB на 0.25 у.е. дальше от BREBN, чем CELLD, поэтому итог - BUTPB и BREBN Задание 2.На Рис.2с представлено парное выравнивание выбранных последовательностей - BUTPB и BREBN. Рис. 2с. Изображение полученного парного выравнивания последовательностей BUTPB и BREBN. Раскраска ClustalX.Задание 3.Последовательности также доступны в fasta-формате: BUTPB и BREBN Задание 4.В данном задании были построены парные выравнивания: глобальные по алгоритму Нидлмана-Вунша (команда needle) и локальные по алгоритму Смита-Ватермана (команда water). При построении данных парных выравниваний используются характеристики: матрица замен весов (по умолчанию BLOSUM62), gap opening penalty - штраф за открытие гэпа (по умолчанию 10.0) и gap extension penalty - штраф за длину гэпа (по умолчанию 0.5). Интересно, что штраф за открытие по умолчанию больше, чем штраф за длину гэпа, так как в большинстве выравниваний более вероятно меньшее количество длинных гэпов, чем большое количество коротких гэпов. На Рис. 3а и Рис. 3b соответственно изображены глобальное и локальное выравнивание последовательностей BUTPB и BREBN, все параметры стоят по умолчанию (матрица замен весов BLOSUM62, gap opening penalty 10.0, gap extension penalty 0.5). С выравниваниями можно ознакомиться в fasta-формате: needle.fasta, water.fasta. Рис. 3a. Изображение глобального парного выравнивания последовательностей BUTPB и BREBN со стандартными характеристиками. Раскраска ClustalX.Рис. 3b. Изображение локального парного выравнивания последовательностей BUTPB и BREBN со стандартными характеристиками. Раскраска ClustalX.Затем я изменил параметры характеристик gap opening penalty и gap extension penalty. Для глобального выравнивания я пытался уменьшить штраф за открытие гэпа, но снижение значения вплоть до 1.0 не давали никаких изменений в выравнивании, попытки увеличить штраф также ни к чему не привели (последовательности почти совпадают по длине и имеют очень много консервативных позиций, нет необходимости в гэпах) На Рис. 4а изображено глобальное парное выравнивание с gap opening penalty = 1 (needle2.fasta). Рис. 4a. Изображение глобального парного выравнивания последовательностей BUTPB и BREBN с gap opening penalty = 1. Раскраска ClustalX.Для локального выравнивания я попробовал изменить (и уменьшать, и увеличивать) штраф за продолжение гэпа, но это не дало результатов из-за того, что выравнивание "хорошее" и без гэпов, поэтому любое снижение штрафов не приводит к их появлению. Поэтому для получения изменений я выставил gap opening penalty значение 0. Для компенсации gap extension penalty = 5 На Рис. 4b представлено локальное парное выравнивание с gap opening penalty = 0 и gap extension penalty = 5 (water2.fasta). Рис. 4b. Изображение локального парного выравнивания последовательностей BUTPB и BREBN с gap opening penalty = 0. Раскраска ClustalX.Задание 5.Для выполнения данного задания были взяты последовательности моего белка - Mutator MutT из Mesorhizobium opportunistum WSM2075, и белка другого студента - dUTP pyrophosphatase из Amycolatopsis orientalis На Рис. 5а и Рис. 5b соответственно изображены глобальное и локальное выравнивание этих последовательностей со стандартными значениями штрафов за открытие и продолжение гэпов. Рис. 5a. Изображение глобального парного выравнивания последовательностей белков с идентификаторами в базе данных RefSeq YP_004610222 и YP_008011580 со стандартными параметрами. Раскраска ClustalX.Рис. 5b. Изображение локального парного выравнивания последовательностей белков с идентификаторами в базе данных RefSeq YP_004610222 и YP_008011580 со стандартными параметрами. Раскраска ClustalX.Задание 7.В данном задании было необходимо сравнить парные выравнивания, построенные программами needle и water, с выравниванием, полученным из множественного. Для этого я добавил парное выравнивание, полученное из множественного, к каждому из четырех выравниваний, ранее полученных с помощью программ. Затем я выровнял одно выравнивание относительно другого, добавляя гэпы там, где это было нужно. Рис. 6a. Изображение глобального парного выравнивания со стандартными параметрами и парного выравнивания, полученного из множественного. Раскраска ClustalX.Рис. 6b. Изображение локального парного выравнивания со стандартными параметрами и парного выравнивания, полученного из множественного. Раскраска ClustalX.Рис. 6c. Изображение глобального парного выравнивания с измененными параметрами и парного выравнивания, полученного из множественного. Раскраска ClustalX.Рис. 6d. Изображение локального парного выравнивания с измененными параметрами и парного выравнивания, полученного из множественного. Раскраска ClustalX.Глобальное выравнивание со стандартными параметрами совпало с исходным парным выравниванием за исключением 2-х сдвигов гэпов в позициях 54-57 и 140-144 (всего 6 различающихся колонок), локальное со стандартными параметрами - то же самое. Глобальное выравнивание с измененными параметрами потребовало вставки нескольких гэпов (61 разл. колонка), тогда как локальное с измененными параметрами - много не всегда очевидных гэпов (97 разл. колонок). На Рис. 7 показаны два участка с различиями (14-16, 19-22) и 5 совпадающими колонками справа и слева от различных колонок (координаты участка: 9-27). Рис. 7. Участок с различиями выравнивания из Рис. 6с. Раскраска ClustalX.Задание 8.В данном задании была произведена попытка проанализировать качество парных выравниваний последовательностей BUTPB и BREBN, полученных с помощью программ needle и water, и выравнивание, полученное из множественного выравнивания, а также выравниваний заведомо негомологичных белков. Для получения численных характеристик (а именно: количество и длина гэпов, процент консервативных позиций и сходных позиций) в качестве почвы для сравнения способов построения выравниваний я воспользовался программой infoalign с опцией -refseq 1. Результаты работы данной программы с вышеперечисленными выравниваниями можно наблюдать в Таблице 1. Таблица 1.
Проанализировав данные таблицы, я пришел к следующим выводам:
|