1. Глобальное и локальное парное выравнивание гомологичных белков

В результате глобального и локального парного выравнивания трёх пар последовательностей гомологичных белков из организмов Escherichia coli и Bacillus subtilis были составлены таблицы с основными характеристиками данных выравнивай. Глобальное парное выравнивание (см. таблицу 1) было проведено с помощью программы needle из пакета биоинформатических программ EMBOSS. Локальное парное выравнивание (см. таблицу 2) проводилось с помощью программы water из того же пакета программ.

таблица 1
Таблица.1. Характеристики глобального парного выравнивания трёх пар белков
таблица 1
Таблица.2. Характеристики локального парного выравнивания трёх пар белков.

Анализ данных показывает, что все три пары белков являются гомологами по всей длине. Для Biotin synthase и Fructose-bisphosphate aldolase локальное выравнивание однозначно информативнее: оно дает более высокий процент идентичности при минимальном количестве гэпов и почти полном покрытии (до 99%). Локальный метод в этих случаях избыточно дробит последовательности, теряя общую картину родства. В паре Cytidine deaminase разница наиболее заметна: при глобальном подходе идентичность вырастает с 13.9% до 32.8%, а число гэпов падает со 176 до 11. Это доказывает, что белки родственны на всем протяжении, просто локальный алгоритм «обрывался» на участках с низким сходством, не в силах преодолеть порог штрафов. Итог: Глобальное выравнивание в данном случае лучше отражает биологическую реальность. Сопоставление букв, которое «пропустил» локальный метод, в глобальном варианте восстанавливается, так как алгоритм обязан учитывать всю длину цепи и находит оптимальный путь там, где локальный поиск видит лишь статистический шум.

Результат применения программ выравнивания к неродственным белкам

Было проведено глобальное (см. таблицу 3) и локальное (см. таблицу 4) выравнивания пары негомологичных (случайных) белков из вышеупомянутых прокариотических организмов. Характеристики обоих выравниваний приведены в соответствующих таблицах.

таблица 1
Таблица.3. Характеристики глобального парного выравнивания пары случайных белков.
таблица 1
Таблица.4. Характеристики локального парного выравнивания пары случайных белков.

Исходя из наблюдаемых характеристик выравниваний, нетрудно заметить, что процент Identity и Similarity даже в локальном парном выравнивании весьма мал (первое меньше 25%), что практически однозначно говорит в пользу того, что данные белки являются неродственными. Также можно отметить весьма маленький вес обоих выравниваний, а также сравнительно большое число гэпов относительно выравниваний гомологичных белков.

Множественное выравнивание белков и импорт в Jalview

Характеристика объектов исследования

Для анализа была выбрана мнемоника ALF_ECOLI. Рекомендованное полное имя белка — Fructose-bisphosphate aldolase class 2. Всего в итоговую выборку вошло 7 последовательностей из следующих организмов:

  • Drosophila melanogaster (Плодовая мушка)
  • Plasmodium falciparum (Малярийный плазмодий)
  • Bacillus subtilis (Сенная палочка)
  • Giardia intestinalis (Лямблия)
  • Haloferax volcanii (Архея)
  • Escherichia coli (Кишечная палочка)
  • Candida albicans (Дрожжеподобный гриб)

Методика выравнивания

Выравнивание проводилось в среде Jalview на основе набора последовательностей в формате FASTA. Использовались алгоритмы множественного выравнивания для сопоставления консервативных колонок и выявления эволюционных взаимосвязей между таксонами.

Ссылка на проект Jalview

Ссылка на файл Jalview

Комментарии к выравниванию

Все исследуемые белки являются гомологами, однако результаты показывают значительную дивергенцию. Первые две последовательности (эукариотические DROME и PLAFK) длиннее остальных, что создает характерный "ступенчатый" вид в начале выравнивания.

  • Консервативные участки: Наиболее высокая плотность совпадающих позиций наблюдается в центральной части выравнивания (примерно в диапазоне столбцов 150–280). Здесь локализованы ключевые аминокислотные остатки, формирующие каталитический центр фермента.
  • Вариабельные участки: Значительная вариабельность и большое количество гэпов (инделов) отмечается на N-концах и в области 80–120 столбцов. Особенно это заметно при сравнении бактериальных форм (ECOLI, BACSU) с эукариотическими.