Учебный сайт Светланы Яровенко
» Семестры » Второй семестр » Выравнивание и гомология

Выравнивание и гомология

Выравнивание — это бионформатический метод, с помощью которого можно предсказать общность происхождения (то есть гомологию) нескольких белков. Чтобы построить выравнивание, последовательности размещают друг под другом, наиболее совпадающие буквы стараются поместить в обну колонку. Очень часто в выравнивании присутствуют "гэпы" — условные символы-вставки для лучшего расположения последовательностей друг под другом.

Если последовательностей более двух, то такое выравнивание называется множественным.

Множественное выравнивание и гомология

Для дальнейшей работы и анализа было выбрано данное выравнивание. Cкачать весь проект Jalview можно отсюда.

Участки, где может ожидаться гомология аминокислотных остатков, представлены на Рисунках 1а и 1б.

Вертикальный блок № 1
Рисунок 1a. Вертикальный блок № 1.
На рисунке изображён участок выравнивания, соответствующий позициям 1-21.
Рисунок получен с помощью программы JalView.
Окрашивание BLOSUM62, Above Identity Threshold >70%.
Скачать блок можно отсюда.
Вертикальный блок № 2
Рисунок 1б. Вертикальный блок № 2.
На рисунке изображён участок выравнивания, соответствующий позициям 122-152.
Рисунок получен с помощью программы JalView.
Окрашивание BLOSUM62, Above Identity Threshold >70%.
Скачать блок можно отсюда.

Участок, на котором остатки двух последовательностей вероятней всего гомологичны, а остальные им нет, представлен на Рисунке 2.

Участок c двумя гомологичными последовательностями

Рисунок 2. Участок выравнивания c двумя гомологичными последовательностями.
Предполагаемо гомологичные последовательности выделены красным пунктиром.
Рисунок получен с помощью программы Jalview. Скачать участок выравнивания можно отсюда.


Чтобы найти последовательности, содержащие участок, показанный выше, с помощью программы JalView было построено дерево сходства. Из Рисунка 3 видно, что наиболее ближние друг к другу последовательности — DANPL и BOMMO.

Дерево сходства последовательностей

Рисунок 3. Дерево сходства последовательностей.
Рисунок получен с помощью программы Jalview. Команда Calculate Tree Average Distance Using BLOSUM62.


Для блока №2 из Рисунка 1б, было найдено число и процент абсолютно консервативных позиций, абсолютно функционально консервативных; консервативных и функционально консервативных на 70%. Всего в этом блоке 31 позиция. Полученные данные приведены в Таблице 1.


Таблица 1. Число и процент различных по консервативности позиций
Консервативность позиции Номера позиций на Рисунке 1б Количество позиций Процент позиций
Абсолютно консервативные 1, 3, 8, 16, 23, 26 6 19%
Абсолютно функционально консервативные 1, 3, 4, 6, 8, 16, 23, 26 8 26%
Консервативные на 70% 6, 7, 9, 11, 13, 18, 20, 22, 30, 31 10 32%
Функционально консервативные на 70% 7, 9, 11, 13, 18, 22, 30, 31 8 26%


На Рисунке 4 приведён участок выравнивания, содержащий близко расположенные вертикальные блоки. В него входит рассмотренный выше блок №2. Число позиций с "гэпами" — 2, что составляет примерно 3,45% от общего числа позиций данного участка.

Близко расположенные вертикальные блоки

Рисунок 4. Близко расположенные вертикальные блоки.
На рисунке изображён участок выравнивания, соответствующий позициям 95-152.
Рисунок получен с помощью программы Jalview. Окраска BLOSUM62, by Conservation 70%. Скачать участок выравнивания можно отсюда.

Выравнивание последовательности относительно вертикального блока

В изначальное выравнивание была добавлена данная последовательность. Был использован поиск консервативных мотивов (Select -> Find), чтобы найти сходные участки относительно блока исходного выравнивания.

Выравнивание производилось относительно блока №2 с помощью следующего поискового запроса: P......KS

Полное выравнивание можно скачать здесь. Результат представлен на Рисунке 5.

Участок выравнивания относительно блока №2

Рисунок 5. Участок выравнивания относительно блока №2.
Рисунок получен с помощью программы JalView. Окрашивание BLOSUM62, Above Identity Threshold >70%. Скачать участок выравнивания можно отсюда.

Консенсусная последовательность и LOGO выбранного блока

Консенсусная последовательность — это обобщённая в данном случае аминокислотная последовательность, полученная на основе сравнения строк выравнивания. Данную последовательность можно получить в самой программе JalView, либо воспользовавшись программой cons на сервере EMBOSS.


Консенсусную последовательность, соответствующую блоку 2 на Рисунке 1б, можно скачать отсюда. С помощью сервиса WebLogo было создано LOGO для того же блока выравнивания. Его изображение можно увидеть на Рисунке 6.

Размер буквы на рисунке говорит о консервативности аминокислоты кислоты, соответствующей данному столбцу выравнивания (номер столбца указан на оси абцисс).

LOGO

Рисунок 6. LOGO блока №2.
Зелёным цветом обозначены полярные аминокислоты (G, S, T, Y, C, Q, N), красным цветом — кислые аминокислоты (D, E), голубым — основные (K, R, H), фиолетовым — гидрофобные (A, V, L, I, P, W, F, M).
Рисунок получен с помощью сервиса WebLogo.

Множественное "выравнивание" заведомо негомологичных (не родственных) белков

Для построения выравнивания было выбрано пять последовательностей белков моих однокурсников. Само же выравнивание было построено с помощью сервиса MUSCLE.

На Рисунке 7 данное выравнивание приведено полностью, на Рисунке 8а и 8б представлены самые лучшие "блоки". Скачать "выравнивнивание" можно по данной ссылке.


Выравнивание заведомо негомологичных белков

Рисунок 7. "Выравнивание" заведомо негомологичных белков.
Выравнивание получено с помощью сервиса MUSCLE, изображение — программы JalView. Окрашивание Clustax, Above Identity Threshold >70%.


Из Рисунка7 видно, что данное выравнивание говорит лишь о различном происхождении данных белков, то есть об их негомологичности.. Во-первых, в глаза сразу бросается множество "гэпов". Также в "выравнивании" всего 7 столбцов, чья консервативность выше 70%, которые к тому же расположены разрозненно. Это может говорить лишь о случайности этих совпадений.

Рисунок 8a. "Блок" выравнивания № 1.
На рисунке изображёны первые 4 последовательности, участок 233-243.
Рисунок получен с помощью программы JalView.
Окрашивание Clustax, Above Identity Threshold >70%.
Рисунок 8б. "Блок" выравнивания № 2.
На рисунке изображёны последние 3 последовательности, участок 77-91.
Рисунок получен с помощью программы JalView.
Окрашивание Clustax, Above Identity Threshold >70%.

Наверх