1. Глобальное и локальное парное выравнивание гомологичных белков
В результате глобального и локального парного выравнивания трёх пар последовательностей гомологичных белков из организмов Escherichia coli и Bacillus subtilis были составлены таблицы с основными характеристиками данных выравнивай. Глобальное парное выравнивание (см. таблицу 1) было проведено с помощью программы needle из пакета биоинформатических программ EMBOSS. Локальное парное выравнивание (см. таблицу 2) проводилось с помощью программы water из того же пакета программ.
Таблица.1. Характеристики глобального парного выравнивания трёх пар белков
Таблица.2. Характеристики локального парного выравнивания трёх пар белков.
Анализ данных показывает, что все три пары белков являются гомологами по всей длине. Для Biotin synthase и Fructose-bisphosphate aldolase локальное выравнивание однозначно информативнее: оно дает более высокий процент идентичности при минимальном количестве гэпов и почти полном покрытии (до 99%). Локальный метод в этих случаях избыточно дробит последовательности, теряя общую картину родства. В паре Cytidine deaminase разница наиболее заметна: при глобальном подходе идентичность вырастает с 13.9% до 32.8%, а число гэпов падает со 176 до 11. Это доказывает, что белки родственны на всем протяжении, просто локальный алгоритм «обрывался» на участках с низким сходством, не в силах преодолеть порог штрафов. Итог: Глобальное выравнивание в данном случае лучше отражает биологическую реальность. Сопоставление букв, которое «пропустил» локальный метод, в глобальном варианте восстанавливается, так как алгоритм обязан учитывать всю длину цепи и находит оптимальный путь там, где локальный поиск видит лишь статистический шум.
Результат применения программ выравнивания к неродственным белкам
Было проведено глобальное (см. таблицу 3) и локальное (см. таблицу 4) выравнивания пары негомологичных (случайных) белков из вышеупомянутых прокариотических организмов. Характеристики обоих выравниваний приведены в соответствующих таблицах.
Таблица.3. Характеристики глобального парного выравнивания пары случайных белков.
Таблица.4. Характеристики локального парного выравнивания пары случайных белков.
Исходя из наблюдаемых характеристик выравниваний, нетрудно заметить, что процент Identity и Similarity даже в локальном парном выравнивании весьма мал (первое меньше 25%), что практически однозначно говорит в пользу того, что данные белки являются неродственными. Также можно отметить весьма маленький вес обоих выравниваний, а также сравнительно большое число гэпов относительно выравниваний гомологичных белков.
Множественное выравнивание белков и импорт в Jalview
Характеристика объектов исследования
Для анализа была выбрана мнемоника ALF_ECOLI. Рекомендованное полное имя белка — Fructose-bisphosphate aldolase class 2. Всего в итоговую выборку вошло 7 последовательностей из следующих организмов:
- Drosophila melanogaster (Плодовая мушка)
- Plasmodium falciparum (Малярийный плазмодий)
- Bacillus subtilis (Сенная палочка)
- Giardia intestinalis (Лямблия)
- Haloferax volcanii (Архея)
- Escherichia coli (Кишечная палочка)
- Candida albicans (Дрожжеподобный гриб)
Методика выравнивания
Выравнивание проводилось в среде Jalview на основе набора последовательностей в формате FASTA. Использовались алгоритмы множественного выравнивания для сопоставления консервативных колонок и выявления эволюционных взаимосвязей между таксонами.
Ссылка на проект Jalview
Комментарии к выравниванию
Все исследуемые белки являются гомологами, однако результаты показывают значительную дивергенцию. Первые две последовательности (эукариотические DROME и PLAFK) длиннее остальных, что создает характерный "ступенчатый" вид в начале выравнивания.
- Консервативные участки: Наиболее высокая плотность совпадающих позиций наблюдается в центральной части выравнивания (примерно в диапазоне столбцов 150–280). Здесь локализованы ключевые аминокислотные остатки, формирующие каталитический центр фермента.
- Вариабельные участки: Значительная вариабельность и большое количество гэпов (инделов) отмечается на N-концах и в области 80–120 столбцов. Особенно это заметно при сравнении бактериальных форм (ECOLI, BACSU) с эукариотическими.