Выравнивание и гомология
Выравнивание — это бионформатический метод, с помощью которого можно предсказать общность происхождения (то есть гомологию) нескольких белков. Чтобы построить выравнивание, последовательности размещают друг под другом, наиболее совпадающие буквы стараются поместить в обну колонку. Очень часто в выравнивании присутствуют "гэпы" — условные символы-вставки для лучшего расположения последовательностей друг под другом.
Если последовательностей более двух, то такое выравнивание называется множественным.
Множественное выравнивание и гомология
Для дальнейшей работы и анализа было выбрано данное выравнивание. Cкачать весь проект Jalview можно отсюда.
Участки, где может ожидаться гомология аминокислотных остатков, представлены на Рисунках 1а и 1б.
На рисунке изображён участок выравнивания, соответствующий позициям 1-21.
Рисунок получен с помощью программы JalView.
Окрашивание BLOSUM62, Above Identity Threshold >70%.
Скачать блок можно отсюда.
На рисунке изображён участок выравнивания, соответствующий позициям 122-152.
Рисунок получен с помощью программы JalView.
Окрашивание BLOSUM62, Above Identity Threshold >70%.
Скачать блок можно отсюда.
Участок, на котором остатки двух последовательностей вероятней всего гомологичны, а остальные им нет, представлен на Рисунке 2.
Рисунок 2. Участок выравнивания c двумя гомологичными последовательностями.
Предполагаемо гомологичные последовательности выделены красным пунктиром.
Рисунок получен с помощью программы Jalview. Скачать участок выравнивания можно отсюда.
Чтобы найти последовательности, содержащие участок, показанный выше, с помощью программы JalView было построено дерево сходства. Из Рисунка 3 видно, что наиболее ближние друг к другу последовательности — DANPL и BOMMO.
Рисунок 3. Дерево сходства последовательностей.
Рисунок получен с помощью программы Jalview. Команда Calculate Tree Average Distance Using BLOSUM62.
Для блока №2 из Рисунка 1б, было найдено число и процент абсолютно консервативных позиций, абсолютно функционально консервативных; консервативных и функционально консервативных на 70%. Всего в этом блоке 31 позиция. Полученные данные приведены в Таблице 1.
Консервативность позиции | Номера позиций на Рисунке 1б | Количество позиций | Процент позиций |
Абсолютно консервативные | 1, 3, 8, 16, 23, 26 | 6 | 19% |
Абсолютно функционально консервативные | 1, 3, 4, 6, 8, 16, 23, 26 | 8 | 26% |
Консервативные на 70% | 6, 7, 9, 11, 13, 18, 20, 22, 30, 31 | 10 | 32% |
Функционально консервативные на 70% | 7, 9, 11, 13, 18, 22, 30, 31 | 8 | 26% |
На Рисунке 4 приведён участок выравнивания, содержащий близко расположенные вертикальные блоки. В него входит рассмотренный выше блок №2. Число позиций с "гэпами" — 2, что составляет примерно 3,45% от общего числа позиций данного участка.
Рисунок 4. Близко расположенные вертикальные блоки.
На рисунке изображён участок выравнивания, соответствующий позициям 95-152.
Рисунок получен с помощью программы Jalview. Окраска BLOSUM62, by Conservation 70%. Скачать участок выравнивания можно отсюда.
Выравнивание последовательности относительно вертикального блока
В изначальное выравнивание была добавлена данная последовательность. Был использован поиск консервативных мотивов (Select -> Find), чтобы найти сходные участки относительно блока исходного выравнивания.
Выравнивание производилось относительно блока №2 с помощью следующего поискового запроса: P......KS
Полное выравнивание можно скачать здесь. Результат представлен на Рисунке 5.
Рисунок 5. Участок выравнивания относительно блока №2.
Рисунок получен с помощью программы JalView.
Окрашивание BLOSUM62, Above Identity Threshold >70%.
Скачать участок выравнивания можно отсюда.
Консенсусная последовательность и LOGO выбранного блока
Консенсусная последовательность — это обобщённая в данном случае аминокислотная последовательность, полученная на основе сравнения строк выравнивания. Данную последовательность можно получить в самой программе JalView, либо воспользовавшись программой cons на сервере EMBOSS.
Консенсусную последовательность, соответствующую блоку 2 на Рисунке 1б, можно скачать отсюда. С помощью сервиса WebLogo было создано LOGO для того же блока выравнивания. Его изображение можно увидеть на Рисунке 6.
Размер буквы на рисунке говорит о консервативности аминокислоты кислоты, соответствующей данному столбцу выравнивания (номер столбца указан на оси абцисс).
Рисунок 6. LOGO блока №2.
Зелёным цветом обозначены полярные аминокислоты (G, S, T, Y, C, Q, N), красным цветом — кислые аминокислоты (D, E), голубым — основные (K, R, H), фиолетовым — гидрофобные (A, V, L, I, P, W, F, M).
Рисунок получен с помощью сервиса WebLogo.
Множественное "выравнивание" заведомо негомологичных (не родственных) белков
Для построения выравнивания было выбрано пять последовательностей белков моих однокурсников. Само же выравнивание было построено с помощью сервиса MUSCLE.
На Рисунке 7 данное выравнивание приведено полностью, на Рисунке 8а и 8б представлены самые лучшие "блоки". Скачать "выравнивнивание" можно по данной ссылке.
Рисунок 7. "Выравнивание" заведомо негомологичных белков.
Выравнивание получено с помощью сервиса MUSCLE, изображение — программы JalView. Окрашивание Clustax, Above Identity Threshold >70%.
Из Рисунка7 видно, что данное выравнивание говорит лишь о различном происхождении данных белков, то есть об их негомологичности.. Во-первых, в глаза сразу бросается множество "гэпов". Также в "выравнивании" всего 7 столбцов, чья консервативность выше 70%, которые к тому же расположены разрозненно. Это может говорить лишь о случайности этих совпадений.
На рисунке изображёны первые 4 последовательности, участок 233-243.
Рисунок получен с помощью программы JalView.
Окрашивание Clustax, Above Identity Threshold >70%.
На рисунке изображёны последние 3 последовательности, участок 77-91.
Рисунок получен с помощью программы JalView.
Окрашивание Clustax, Above Identity Threshold >70%.