1. Глобальное и локальное парное выравнивание гомологичных белков

В результате глобального и локального парного выравнивания трёх пар последовательностей гомологичных белков из организмов Escherichia coli и Bacillus subtilis были составлены таблицы с основными характеристиками данных выравнивай. Глобальное парное выравнивание (см. таблицу 1) было проведено с помощью программы needle из пакета биоинформатических программ EMBOSS. Локальное парное выравнивание (см. таблицу 2) проводилось с помощью программы water из того же пакета программ.

таблица 1
Таблица.1. Характеристики глобального парного выравнивания трёх пар белков
таблица 1
Таблица.2. Характеристики локального парного выравнивания трёх пар белков.

Анализ данных показывает, что все три пары белков являются гомологами по всей длине. Для Biotin synthase и Fructose-bisphosphate aldolase локальное выравнивание однозначно информативнее: оно дает более высокий процент идентичности при минимальном количестве гэпов и почти полном покрытии (до 99%). Локальный метод в этих случаях избыточно дробит последовательности, теряя общую картину родства. В паре Cytidine deaminase разница наиболее заметна: при глобальном подходе идентичность вырастает с 13.9% до 32.8%, а число гэпов падает со 176 до 11. Это доказывает, что белки родственны на всем протяжении, просто локальный алгоритм «обрывался» на участках с низким сходством, не в силах преодолеть порог штрафов. Итог: Глобальное выравнивание в данном случае лучше отражает биологическую реальность. Сопоставление букв, которое «пропустил» локальный метод, в глобальном варианте восстанавливается, так как алгоритм обязан учитывать всю длину цепи и находит оптимальный путь там, где локальный поиск видит лишь статистический шум.

Результат применения программ выравнивания к неродственным белкам

Было проведено глобальное (см. таблицу 3) и локальное (см. таблицу 4) выравнивания пары негомологичных (случайных) белков из вышеупомянутых прокариотических организмов. Характеристики обоих выравниваний приведены в соответствующих таблицах.

таблица 1
Таблица.3. Характеристики глобального парного выравнивания пары случайных белков.
таблица 1
Таблица.4. Характеристики локального парного выравнивания пары случайных белков.

Исходя из наблюдаемых характеристик выравниваний, нетрудно заметить, что процент Identity и Similarity даже в локальном парном выравнивании весьма мал (первое меньше 25%), что практически однозначно говорит в пользу того, что данные белки являются неродственными. Также можно отметить весьма маленький вес обоих выравниваний, а также сравнительно большое число гэпов относительно выравниваний гомологичных белков.

Множественное выравнивание белков и импорт в Jalview

Характеристика объектов исследования

Для анализа была выбрана мнемоника ALF_ECOLI. Рекомендованное полное имя белка — Fructose-bisphosphate aldolase class 2. Всего в итоговую выборку вошло 7 последовательностей из следующих организмов:

  • Drosophila melanogaster (Плодовая мушка)
  • Plasmodium falciparum (Малярийный плазмодий)
  • Bacillus subtilis (Сенная палочка)
  • Giardia intestinalis (Лямблия)
  • Haloferax volcanii (Архея)
  • Escherichia coli (Кишечная палочка)
  • Candida albicans (Дрожжеподобный гриб)

Методика выравнивания

Cемь FASTA-файлов были импортированы в Jalview. Множественное выравнивание выполнялось программой clustalo, результат был сохранён в файле prak9.fasta. В Jalview колонки выравнивания были окрашены по схеме Percentage Identity.

Ссылка на проект Jalview

Ссылка на файл Jalview

Комментарии к выравниванию

На выравнивании четко прослеживается эволюционное разделение белков на два структурно-функциональных класса: первый класс представляют эукариоты ALF_DROME и ALF_PLAFK, а второй — все остальные организмы. В первой трети выравнивания у представителей первого класса наблюдается непрерывная последовательность, тогда как у второго класса в этом же месте присутствует масштабная общая делеция длиной около 50 аминокислот.

Несмотря на глубокую дивергенцию, в центральной части выравнивания идеально сопоставились ключевые функциональные мотивы, формирующие активный центр фермента. Для второго класса это жестко консервативный металл-связывающий блок MID[A/L]S, в то время как у первого класса в этой позиции зафиксирован собственный уникальный паттерн VEPE[V/I]L. Ближе к C-концу выравнивания все семь белков снова объединяются вокруг общего структурного «якоря» — консервативного глицинового мотива (HGGSG / HGGTG), отвечающего за крутой изгиб цепи при укладке белка.

Примечательно, что эукариотические организмы ALF_GIAIC (лямблия) и ALF_CANAL (дрожжи) полностью выбиваются из своей группы и выравниваются по прокариотическому типу вместе с бактериями и археей. Такая специфическая блочная архитектура и групповой характер вставок доказывают общую гомологию и единый тип пространственной укладки (TIM-бочонок) для всех представленных альдолаз.