Учебный сайт Светланы Яровенко
» Семестры » Второй семестр » Предсказание парных выравниваний

Предсказание парных выравниваний

Парное выравнивание — это выравнивание двух последовательностей, с помошью которого в них находят сходные участки. Выравнивание строят как вручную, так и с использованием специальных программ.

В парном выравнивании различают глобальное и локальное. Глобальное выравнивание строится по всей длине последовательностей с помощью алгоритма Нидлмана-Вунша. Локальное выравнивание исключает негомологичные участки, и выравнивание происходит только между гомологичными. Здесь используется алгоритм Смита-Ватермана.


Полный проект JalView можно скачать отсюда. Использованное множественное выравнивнивание представлено на Рисунке 1.

Выбранное множественное выравнивание

Рисунок 1. "Выбранное множественное выравнивание.
Красной рамочкой выделены две последние последовательности, которые позже использовались для построения парного выравнивания.
Изображение получено с помощью программы JalView. Окрашивание BLOSUM62, Conservation 70%.


Построение парного выравнивания

Для построения парного выравнивания из множественного были выбраны две последние последовательности. Все остальные последовательности были удалены, а также были убраны колонки, состоявшие только из "гэпов". Полученное парное выравнивание представлено на Рисунке 2.

Парное выравнивание, построенное на основе множественного

Рисунок 2. Парное выравнивание, построенное на основе множественного.
Изображение получено с помощью программы JalView. Окрашивание Clustalx, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь.


Глобальное и локальное выравнивания

С помощью программы needle из пакета EMBOSS, было получено глобальное выравнивание данных последовательностей. Если сравнить Рисунок 3 и Рисунок 2, то очевидно некоторое различие между данными выравниваниями.

Глобальное парное выравнивание

Рисунок 3. Глобальное парное выравнивание.
Выравнивание получено с помощью программы needle, изображение — программы JalView. Окрашивание Clustalx, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.


Наилучшее локальное выравнивание было построено после использования программы water. Полученное выравнивание можно увидеть на Рисунке 4.

Локальное парное выравнивание

Рисунок 4. Локальное парное выравнивание.
Выравнивание получено с помощью программы water, изображение — программы JalView. Окрашивание Clustalx, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.


Глобальное и локальное выравнивания двух заведомо негомологичных белков

Аналогичные операции были произведены над двумя последовательностями заведомо негомологичных белков. Это белок дегидратаза (идентификатор в базе данных Refseq YP_001633816.1) и АТФ-связывающий кассетный транспортёр, переплазматический связывающий белок (идентификатор в базе данных Refseq YP_209034.1). Полученные глобальное и локальное выравнивания представлены на Рисунке 5 и 6 соответственно.

Глобальное выравнивание двух заведомо негомологичных белков

Рисунок 5. Глобальное выравнивание двух заведомо негомологичных белков.
Выравнивание получено с помощью программы needle, изображение — программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.


Локальное выравнивание двух заведомо негомологичных белков

Рисунок 6. Локальное выравнивание двух заведомо негомологичных белков.
Выравнивание получено с помощью программы water, изображение — программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.


Сравнение полученных выравниваний

Для сравнения полученных выравниваний была составлена Таблица 1. Значения для выравниваний частично были взяты из файлов формата needle и water и частично посчитаны вручную.


Таблица 1. Параметры полученных выравниваний.
Выравнивание Длина Число совпадений Процент совпадений Число сходных остатков Процент сходных остатков Число "гэпов" Процент "гэпов" Число открытий гэпов
Парное выравнивание, полученное из множественного 149 36 24% 47 31.5% 20 13% 9
Глобальное выравнивание последних двух последовательностей 166 39 23.5% 56 33.7% 54 32.5% 6
Локальное выравнивание последних двух последовательностей 96 33 34.5% 47 49% 11 11.5% 4
Глобальное выравнивание двух заведомо негомологичных белков 557 24 4.3% 36 6.5% 478 85.8% 6
Локальное выравнивание двух заведомо негомологичных белков 80 20 25% 30 37.5% 17 21.2% 4

Исходя из представленных выше данных, можно заметить, что парное выравнивание предположительно гомологичных последовательностей, полученное из множественного, не особо отличается от глобального по процентам схожих и совпадающих аминокислот. В полученном из множественного выравнивании меньше процент "гэпов", и по своим характеристикам оно стремится к локальному выравниванию. Небольшие различия в параметрах этих трёх выравниваний как раз и дают основания считать эти два белка гомологичными.

Если говорить о выравниваниях заведомо негомологичных белков, то в глаза сразу бросается огромная разница в показателях глобального и локального выравниваний. Число "гэпов" велико, да и длины самих выравниваний несоизмеримы. Всё это может говорить лишь о том, что вероятность гомологичности данных белков крайне мала.


Отдельно было рассмотрено локальное выравнивание и парное, которое было получено из множественного. На Рисунке 7 изображён один из участков различия данных выравниваний. Проект JalView, в котором видны основные участки сходства и различия, можно скачать отсюда.

Участок различия

Рисунок 7. Участок различия глобального выравнивания и парного выравнивания, полученного с помощью множественного.
Красной рамочкой выделен участок различия, соответствующий 46-56 позициям.
Рисунок получен с помощью программы Jalview. Окраска BLOSUM62, Conservation 70%.

Всего три участка различия: 1-31, 46-56, 131-170 позиции соответственно. С 53 по 130 позицию идёт огромный участок сходства.


Оценка правильности выравниваний

Чтобы оценить правильность каждого выравнивания, с помощью программ SupCheck и Rasmol было проведено пространственное совмещение структур предполагаемо гомологичных белков.

На Рисунке 8 и 9 представлены парное, полученное из множественного, и локальное выравнивания этих двух последовательностей со специальной разметкой. Знак "+" говорит о достоверности данного выравнивания, "S" — о пространственном совмещении структур.

Для оценки правильности выравниваний были введены такие понятия, как ошибки первого и второго рода. Ошибкой первого рода считалась ситуация, когда выравнивание было отмечено достоверным, но приэтом Cα-атомы этих пар аминокислотных остатков не совмещались; ошибкой второго рода — Cα-атомы двух остатков хорошо совмещаются, но колонка не отмечена знаком "+" или же эти остатки просто находятся в разных колонках.


Исходя из Рисунка 8, ошибок первого рода 7, а второго — 14.

Оценка правильности парного выравнивания, построенного на основе множественного

Рисунок 8. Оценка правильности парного выравнивания, построенного на основе множественного.
"1" отмечены ошибки первого рода, "2" — второго.
Изображение получено с помощью программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Проект JalView можно скачать отсюда.


Исходя из Рисунка 9, ошибок первого рода 21, а второго — 7.

Оценка правильности глобального выравнивания

Рисунок 9. Оценка правильности глобального выравнивания.
"1" отмечены ошибки первого рода, "2" — второго.
Выравнивание получено с помощью программы needle, изображение — программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Проект JalView можно скачать отсюда..


Сравнив общее количество ошибок для кождого из выравниваний, прийдём к выводу, что парное выравнивание, основанное на множественном, более удачное, несмотря на то, что ошибок второго рода здесь получилось в два раза больше.


Наверх