Учебный сайт Мухалевой Лизаветы

Предсказание парных выравниваний

       В данном практикуме мы продолжаем изучать выравнивания, только теперь уже парные - изучаем алгоритм построения, вероятность достоверного сходства/случайного совпадения; а также знакомимся с программамиNeedle и Water, являющимися, как и уже известный Jalview, утилитами для построения выравниваний.

       Для начала я загрузила исходное выравнивание и прокрасила его со следующими характеристиками: ClustalX с параметром консервативности (Above identity threshold ) > 70% (фрагмент выравнивания представлен на рисунке 1). Далее выделила пару последних последовательностей и в отдельном окне построила их парное выравнивание с теми же характеристиками (фрагмент этого выравнивания представлен на рисунке 2). Результаты были сохранены в виде проекта.

Фрагмент множественного выравнивания

Рисунок 1.Фрагмент множественного выравнивания (позиции №№ 18-57). Получено с помощью Jalview.

Фрагмент парного выравнивания

Рисунок 2.Фрагмент парного выравнивания (позиции №№ 1-90). Получено с помощью Jalview.

       Далее от нас требовалось построить глобальное выравнивание последних двух последовательностей с помощью Needle - пакета EMBOSS. Для этого потребовалось создать два fasta-файла с последовательностями и проделать в Putty следующие действия: вызвать пакет needle, ввести название первого файла, затем второго и название файла на выход. Результат сохранён в двух форматах: .needle и .fasta (для сохранения в формате fasta использовалась опция -aformat3 fasta). Фрагмент полученного глобального выравнивания представлен на рисунке 3.

Фрагмент глобального выравнивания

Рисунок 3.Фрагмент глобального выравнивания (позиции №№ 70-155). Получено с помощью Jalview.

       Следующим этапом было создание локального выравнивания. Его построение производилось с помощью другого пакета EMBOSS - Water. Для этого нам потребовались те же fasta-файлы, с которыми были проведены аналогичные действия. Результатом также стали два файла: .water и .fasta, а фрагмент выравнивания представлен на рисунке 4.

Фрагмент локального выравнивания

Рисунок 4.Фрагмент локального выравнивания (позиции №№ 69-151). Получено с помощью Jalview.

       Теперь, в противовес предыдущим заданиям, нам необходимо было построить парное выравнивания последовательностей двух заведомо негомологичных белков. Я выбрала свой белок, пептидазу из G.sulfurreducens PCA, и белок Софроновой Алины, аспартоацилазу из Shewanella frigidimarina NCIMB 400. Для построения выравниваний использовались needle и water, алгоритм действий такой же, как и с предыдущими последовательностями. Результами стали четыре файла: .needle, .fasta (глобальное выравнивание, фрагмент представлен на рисунке 5), .water, .fasta (локальное выравнивание, фрагмент представлен на рисунке 6). По рисункам видно, что выравнивания не являются достоверными, так как между небольшими вертикальными блоками длинные проммежутки из гэпов, а если просмотреть файл с глобальным выравниванием, то эти огромные промежутки будут и в конце, и в начале, что лишь подтверждает, что белки очевидно не являются гомологичными, что и предполагалось.

Фрагмент локального выравнивания негомологичных белков

Рисунок 5.Фрагмент глобального выравнивания негомологичных белков (позиции №№ 269-353). Получено с помощью Jalview.

Фрагмент локального выравнивания негомологичных белков

Рисунок 6.Фрагмент локального выравнивания негомологичных белков(позиции №№ 1-62). Получено с помощью Jalview.

       После построения выравниваний, нужно их проанализировать. Для этого использовалась опция infoalign, подключённая на kodomo. На вход она требует fasta-форматы каждого выравнивания, форматы по умолчанию(.needle, .water) при подаче на вход выдают ошибку. После получения файлов с информацией о выравниваниях, была составлена таблица 1, в которой подведены итоги.

Таблица 1. Таблица характеристик выравниваний гомологичных и негомологичных последовательностей.

Вид последовательностей Тип выравнивания Длина выравнивания Число совпадений Процент совпадений Число сходных остатков Процент сходных остатков Число гэпов Процент гэпов Число открытий гэпов
Гомологичные из множественного выравнивания глобальное 154; 159 50 32.5%; 31,5% 15 9,7%; 9,5% 22; 20 17%; 14% 4; 3
локальное 151; 151 50 33% 15 10% 22; 20 14,5%; 13% 4; 3
Негомологичные глобальное 292; 383 26 8,9%; 6,8% 24 8,2%; 6,1% 28; 11 9,6%; 2,9% 5; 3
локальное 62; 62 17 27,4% 8 12,9% 15; 0 24%; 0% 3; 0

       Из таблицы видно, что выравнивание негомологичных последовательностей имеет низкие показатели, что было предсказуемо. В выравниваниях гомологичных последовательностей различия только в самой длине выравнивания - ровно на то количество конечных аминокислот, которые отрезались при построении локального выравнивания. Поэтому дальнейшие различия появляются лишь в процентном содержании, а количества совпадают.
       После построения различных выравниваний и их сравнения, нужно было провести наглядное сравнение парного выравнивания, которое получили просто вырезанием из множественного выравнивания, и глобального выравнивания. Так как эти выравнивания не должны совпадать, то нужно было подвигать глобальное относительно парного, чтобы добиться совпадения с выравниванием тех же последовательностей в исходном множественном выравнивании. Очень хорошо выравнялось начало - всего лишь один промежуток гэпов (позиции №№ 9-11) на довольно крупный участок совпадения (приведён на рисунке 7). Также в задании требовалось показать участок различия, заключённый между двумя совпадающими участками длиной в пять колонок/ На рисунке 8 приведён участок между первым совпадающим блоком (позиции №№ 45-56) и вторым (позиции №№ 110-122). Сам участок различия имеет координаты №№ 57-110, на нём парное выравнивание почти полностью расходится (имеет 53 различных столбцов), а глобальное имеет одно совпадение в позиции №86, причём одна из последовательностей парного выравнивания тоже совпадает с этим столбцом. Также имется один консервативный столбик на позиции № 117, но я решила его включить в несопадающий участок, так как сразу за ним идёт блок совпадения.

Фрагмент совпадения выравниваний

Рисунок 7. Участок совпадения парного и глобального выравниваний (позиции №№ 1-56). Получено с помощью Jalview.

Фрагмент различия выравниваний

Рисунок 8. Участок различия парного и глобального выравниваний (позиции №№ 45-122). Получено с помощью Jalview.

       Теперь выравниваниz на количество ошибок при построении. Ошибки бывают 2ух типов: C_alpha атомы пары остатков в колонке выравнивания, отмеченной "+", в структуре не совмещаются и C_alpha атомы двух остатков хорошо совмещаются, но соответствующие буквы либо не находятся в одной колонке, либо в одной колонке, но колонка не отмечена "+". Количество ошибок для парного выравнивания: первого рода - 34 штук, второго рода - 4 штуки. Количество ошибок для глобального выравнивания: первого рода - 18 штук, второго рода - 7 штуки Фрагменты указания ошибок в выравнивании указан на рисунках 9 и 10.

Фрагмент указания ошибок

Рисунок 9. Участок парного выравнивания с указанием ошибок (позиции №№ 1-86). Получено с помощью Jalview.

Фрагмент указания ошибок

Рисунок 10. Участок глобального выравнивания с указанием ошибок (позиции №№ 1-86). Получено с помощью Jalview.

       Итоговый проект данного практикума можно скачать здесь.

       Проект с проверкой правильных выравниваний.

© Mukhaleva Elizaveta, FBB MSU, 2013
Дата последнего изменения: 25.03.2014

Valid HTML 4.01 Strict Правильный CSS!