1. Глобальное и локальное парное выравнивание гомологичных белков
В результате глобального и локального парного выравнивания трёх пар последовательностей гомологичных белков из организмов Escherichia coli и Bacillus subtilis были составлены таблицы с основными характеристиками данных выравнивай. Глобальное парное выравнивание (см. таблицу 1) было проведено с помощью программы needle из пакета биоинформатических программ EMBOSS. Локальное парное выравнивание (см. таблицу 2) проводилось с помощью программы water из того же пакета программ.
Таблица.1. Характеристики глобального парного выравнивания трёх пар белков
Таблица.2. Характеристики локального парного выравнивания трёх пар белков.
Анализ данных показывает, что все три пары белков являются гомологами по всей длине. Для Biotin synthase и Fructose-bisphosphate aldolase локальное выравнивание однозначно информативнее: оно дает более высокий процент идентичности при минимальном количестве гэпов и почти полном покрытии (до 99%). Локальный метод в этих случаях избыточно дробит последовательности, теряя общую картину родства. В паре Cytidine deaminase разница наиболее заметна: при глобальном подходе идентичность вырастает с 13.9% до 32.8%, а число гэпов падает со 176 до 11. Это доказывает, что белки родственны на всем протяжении, просто локальный алгоритм «обрывался» на участках с низким сходством, не в силах преодолеть порог штрафов. Итог: Глобальное выравнивание в данном случае лучше отражает биологическую реальность. Сопоставление букв, которое «пропустил» локальный метод, в глобальном варианте восстанавливается, так как алгоритм обязан учитывать всю длину цепи и находит оптимальный путь там, где локальный поиск видит лишь статистический шум.
Результат применения программ выравнивания к неродственным белкам
Было проведено глобальное (см. таблицу 3) и локальное (см. таблицу 4) выравнивания пары негомологичных (случайных) белков из вышеупомянутых прокариотических организмов. Характеристики обоих выравниваний приведены в соответствующих таблицах.
Таблица.3. Характеристики глобального парного выравнивания пары случайных белков.
Таблица.4. Характеристики локального парного выравнивания пары случайных белков.
Исходя из наблюдаемых характеристик выравниваний, нетрудно заметить, что процент Identity и Similarity даже в локальном парном выравнивании весьма мал (первое меньше 25%), что практически однозначно говорит в пользу того, что данные белки являются неродственными. Также можно отметить весьма маленький вес обоих выравниваний, а также сравнительно большое число гэпов относительно выравниваний гомологичных белков.
Множественное выравнивание белков и импорт в Jalview
Характеристика объектов исследования
Для анализа была выбрана мнемоника ALF_ECOLI. Рекомендованное полное имя белка — Fructose-bisphosphate aldolase class 2. Всего в итоговую выборку вошло 7 последовательностей из следующих организмов:
- Drosophila melanogaster (Плодовая мушка)
- Plasmodium falciparum (Малярийный плазмодий)
- Bacillus subtilis (Сенная палочка)
- Giardia intestinalis (Лямблия)
- Haloferax volcanii (Архея)
- Escherichia coli (Кишечная палочка)
- Candida albicans (Дрожжеподобный гриб)
Методика выравнивания
Cемь FASTA-файлов были импортированы в Jalview. Множественное выравнивание выполнялось программой clustalo, результат был сохранён в файле prak9.fasta. В Jalview колонки выравнивания были окрашены по схеме Percentage Identity.
Ссылка на проект Jalview
Комментарии к выравниванию
На выравнивании четко прослеживается эволюционное разделение белков на два структурно-функциональных класса: первый класс представляют эукариоты ALF_DROME и ALF_PLAFK, а второй — все остальные организмы. В первой трети выравнивания у представителей первого класса наблюдается непрерывная последовательность, тогда как у второго класса в этом же месте присутствует масштабная общая делеция длиной около 50 аминокислот.
Несмотря на глубокую дивергенцию, в центральной части выравнивания идеально сопоставились ключевые функциональные мотивы, формирующие активный центр фермента. Для второго класса это жестко консервативный металл-связывающий блок MID[A/L]S, в то время как у первого класса в этой позиции зафиксирован собственный уникальный паттерн VEPE[V/I]L. Ближе к C-концу выравнивания все семь белков снова объединяются вокруг общего структурного «якоря» — консервативного глицинового мотива (HGGSG / HGGTG), отвечающего за крутой изгиб цепи при укладке белка.
Примечательно, что эукариотические организмы ALF_GIAIC (лямблия) и ALF_CANAL (дрожжи) полностью выбиваются из своей группы и выравниваются по прокариотическому типу вместе с бактериями и археей. Такая специфическая блочная архитектура и групповой характер вставок доказывают общую гомологию и единый тип пространственной укладки (TIM-бочонок) для всех представленных альдолаз.