Предсказание парных выравниваний
Парное выравнивание — это выравнивание двух последовательностей, с помошью которого в них находят сходные участки. Выравнивание строят как вручную, так и с использованием специальных программ.
В парном выравнивании различают глобальное и локальное. Глобальное выравнивание строится по всей длине последовательностей с помощью алгоритма Нидлмана-Вунша. Локальное выравнивание исключает негомологичные участки, и выравнивание происходит только между гомологичными. Здесь используется алгоритм Смита-Ватермана.
Полный проект JalView можно скачать отсюда. Использованное множественное выравнивнивание представлено на Рисунке 1.
![Выбранное множественное выравнивание Выбранное множественное выравнивание](images/10all.png)
Рисунок 1. "Выбранное множественное выравнивание.
Красной рамочкой выделены две последние последовательности, которые позже использовались для построения парного выравнивания.
Изображение получено с помощью программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Построение парного выравнивания
Для построения парного выравнивания из множественного были выбраны две последние последовательности. Все остальные последовательности были удалены, а также были убраны колонки, состоявшие только из "гэпов". Полученное парное выравнивание представлено на Рисунке 2.
![Парное выравнивание, построенное на основе множественного Парное выравнивание, построенное на основе множественного](images/10m.png)
Рисунок 2. Парное выравнивание, построенное на основе множественного.
Изображение получено с помощью программы JalView. Окрашивание Clustalx, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь.
Глобальное и локальное выравнивания
С помощью программы needle из пакета EMBOSS, было получено глобальное выравнивание данных последовательностей. Если сравнить Рисунок 3 и Рисунок 2, то очевидно некоторое различие между данными выравниваниями.
![Глобальное парное выравнивание Глобальное парное выравнивание](images/10n.png)
Рисунок 3. Глобальное парное выравнивание.
Выравнивание получено с помощью программы needle, изображение — программы JalView. Окрашивание Clustalx, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.
Наилучшее локальное выравнивание было построено после использования программы water. Полученное выравнивание можно увидеть на Рисунке 4.
![Локальное парное выравнивание Локальное парное выравнивание](images/10w.png)
Рисунок 4. Локальное парное выравнивание.
Выравнивание получено с помощью программы water, изображение — программы JalView. Окрашивание Clustalx, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.
Глобальное и локальное выравнивания двух заведомо негомологичных белков
Аналогичные операции были произведены над двумя последовательностями заведомо негомологичных белков. Это белок дегидратаза (идентификатор в базе данных Refseq YP_001633816.1) и АТФ-связывающий кассетный транспортёр, переплазматический связывающий белок (идентификатор в базе данных Refseq YP_209034.1). Полученные глобальное и локальное выравнивания представлены на Рисунке 5 и 6 соответственно.
![Глобальное выравнивание двух заведомо негомологичных белков Глобальное выравнивание двух заведомо негомологичных белков](images/10nn.png)
Рисунок 5. Глобальное выравнивание двух заведомо негомологичных белков.
Выравнивание получено с помощью программы needle, изображение — программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.
![Локальное выравнивание двух заведомо негомологичных белков Локальное выравнивание двух заведомо негомологичных белков](images/10nw.png)
Рисунок 6. Локальное выравнивание двух заведомо негомологичных белков.
Выравнивание получено с помощью программы water, изображение — программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Скачать выравнивание в формате fasta можно здесь, в формате по умолчанию — отсюда.
Сравнение полученных выравниваний
Для сравнения полученных выравниваний была составлена Таблица 1. Значения для выравниваний частично были взяты из файлов формата needle и water и частично посчитаны вручную.
Выравнивание | Длина | Число совпадений | Процент совпадений | Число сходных остатков | Процент сходных остатков | Число "гэпов" | Процент "гэпов" | Число открытий гэпов |
Парное выравнивание, полученное из множественного | 149 | 36 | 24% | 47 | 31.5% | 20 | 13% | 9 |
Глобальное выравнивание последних двух последовательностей | 166 | 39 | 23.5% | 56 | 33.7% | 54 | 32.5% | 6 |
Локальное выравнивание последних двух последовательностей | 96 | 33 | 34.5% | 47 | 49% | 11 | 11.5% | 4 |
Глобальное выравнивание двух заведомо негомологичных белков | 557 | 24 | 4.3% | 36 | 6.5% | 478 | 85.8% | 6 |
Локальное выравнивание двух заведомо негомологичных белков | 80 | 20 | 25% | 30 | 37.5% | 17 | 21.2% | 4 |
Исходя из представленных выше данных, можно заметить, что парное выравнивание предположительно гомологичных последовательностей, полученное из множественного, не особо отличается от глобального по процентам схожих и совпадающих аминокислот. В полученном из множественного выравнивании меньше процент "гэпов", и по своим характеристикам оно стремится к локальному выравниванию. Небольшие различия в параметрах этих трёх выравниваний как раз и дают основания считать эти два белка гомологичными.
Если говорить о выравниваниях заведомо негомологичных белков, то в глаза сразу бросается огромная разница в показателях глобального и локального выравниваний. Число "гэпов" велико, да и длины самих выравниваний несоизмеримы. Всё это может говорить лишь о том, что вероятность гомологичности данных белков крайне мала.
Отдельно было рассмотрено локальное выравнивание и парное, которое было получено из множественного. На Рисунке 7 изображён один из участков различия данных выравниваний. Проект JalView, в котором видны основные участки сходства и различия, можно скачать отсюда.
![Участок различия Участок различия](images/10com.png)
Рисунок 7. Участок различия глобального выравнивания и парного выравнивания, полученного с помощью множественного.
Красной рамочкой выделен участок различия, соответствующий 46-56 позициям.
Рисунок получен с помощью программы Jalview. Окраска BLOSUM62, Conservation 70%.
Всего три участка различия: 1-31, 46-56, 131-170 позиции соответственно. С 53 по 130 позицию идёт огромный участок сходства.
Оценка правильности выравниваний
Чтобы оценить правильность каждого выравнивания, с помощью программ SupCheck и Rasmol было проведено пространственное совмещение структур предполагаемо гомологичных белков.
На Рисунке 8 и 9 представлены парное, полученное из множественного, и локальное выравнивания этих двух последовательностей со специальной разметкой. Знак "+" говорит о достоверности данного выравнивания, "S" — о пространственном совмещении структур.
Для оценки правильности выравниваний были введены такие понятия, как ошибки первого и второго рода. Ошибкой первого рода считалась ситуация, когда выравнивание было отмечено достоверным, но приэтом Cα-атомы этих пар аминокислотных остатков не совмещались; ошибкой второго рода — Cα-атомы двух остатков хорошо совмещаются, но колонка не отмечена знаком "+" или же эти остатки просто находятся в разных колонках.
Исходя из Рисунка 8, ошибок первого рода 7, а второго — 14.
![Оценка правильности парного выравнивания, построенного на основе множественного Оценка правильности парного выравнивания, построенного на основе множественного](images/10error1.png)
Рисунок 8. Оценка правильности парного выравнивания, построенного на основе множественного.
"1" отмечены ошибки первого рода, "2" — второго.
Изображение получено с помощью программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Проект JalView можно скачать отсюда.
Исходя из Рисунка 9, ошибок первого рода 21, а второго — 7.
![Оценка правильности глобального выравнивания Оценка правильности глобального выравнивания](images/10error2.png)
Рисунок 9. Оценка правильности глобального выравнивания.
"1" отмечены ошибки первого рода, "2" — второго.
Выравнивание получено с помощью программы needle, изображение — программы JalView. Окрашивание BLOSUM62, Conservation 70%.
Проект JalView можно скачать отсюда..
Сравнив общее количество ошибок для кождого из выравниваний, прийдём к выводу, что парное выравнивание, основанное на множественном, более удачное, несмотря на то, что ошибок второго рода здесь получилось в два раза больше.