1. Глобальное и локальное парное выравнивание гомологичных белков
В результате глобального и локального парного выравнивания трёх пар последовательностей гомологичных белков из организмов Escherichia coli и Bacillus subtilis были составлены таблицы с основными характеристиками данных выравнивай. Глобальное парное выравнивание (см. таблицу 1) было проведено с помощью программы needle из пакета биоинформатических программ EMBOSS. Локальное парное выравнивание (см. таблицу 2) проводилось с помощью программы water из того же пакета программ.
Таблица.1. Характеристики глобального парного выравнивания трёх пар белков
Таблица.2. Характеристики локального парного выравнивания трёх пар белков.
Анализ данных показывает, что все три пары белков являются гомологами по всей длине. Для Biotin synthase и Fructose-bisphosphate aldolase локальное выравнивание однозначно информативнее: оно дает более высокий процент идентичности при минимальном количестве гэпов и почти полном покрытии (до 99%). Локальный метод в этих случаях избыточно дробит последовательности, теряя общую картину родства. В паре Cytidine deaminase разница наиболее заметна: при глобальном подходе идентичность вырастает с 13.9% до 32.8%, а число гэпов падает со 176 до 11. Это доказывает, что белки родственны на всем протяжении, просто локальный алгоритм «обрывался» на участках с низким сходством, не в силах преодолеть порог штрафов. Итог: Глобальное выравнивание в данном случае лучше отражает биологическую реальность. Сопоставление букв, которое «пропустил» локальный метод, в глобальном варианте восстанавливается, так как алгоритм обязан учитывать всю длину цепи и находит оптимальный путь там, где локальный поиск видит лишь статистический шум.
Результат применения программ выравнивания к неродственным белкам
Было проведено глобальное (см. таблицу 3) и локальное (см. таблицу 4) выравнивания пары негомологичных (случайных) белков из вышеупомянутых прокариотических организмов. Характеристики обоих выравниваний приведены в соответствующих таблицах.
Таблица.3. Характеристики глобального парного выравнивания пары случайных белков.
Таблица.4. Характеристики локального парного выравнивания пары случайных белков.
Исходя из наблюдаемых характеристик выравниваний, нетрудно заметить, что процент Identity и Similarity даже в локальном парном выравнивании весьма мал (первое меньше 25%), что практически однозначно говорит в пользу того, что данные белки являются неродственными. Также можно отметить весьма маленький вес обоих выравниваний, а также сравнительно большое число гэпов относительно выравниваний гомологичных белков.
Множественное выравнивание белков и импорт в Jalview
Характеристика объектов исследования
Для анализа была выбрана мнемоника ALF_ECOLI. Рекомендованное полное имя белка — Fructose-bisphosphate aldolase class 2. Всего в итоговую выборку вошло 7 последовательностей из следующих организмов:
- Drosophila melanogaster (Плодовая мушка)
- Plasmodium falciparum (Малярийный плазмодий)
- Bacillus subtilis (Сенная палочка)
- Giardia intestinalis (Лямблия)
- Haloferax volcanii (Архея)
- Escherichia coli (Кишечная палочка)
- Candida albicans (Дрожжеподобный гриб)
Методика выравнивания
Cемь FASTA-файлов были импортированы в Jalview. Множественное выравнивание выполнялось программой clustalo, результат был сохранён в файле prak9.fasta. В Jalview колонки выравнивания были окрашены по схеме Percentage Identity.
Ссылка на проект Jalview
Комментарии к выравниванию
На выравнивании четко прослеживается разделение на несколько групп относительно схожести выравниваний ALF_BASCU и ALF_GIAIC представленной бактериями и сестринская клада к ним ALF_HALVID. ALF_ECOLI и ALF_CANAL, ALF_DROME и ALF_PLAFK (представленная эукариотами). В выравнивании трудно выделить консервативные блоки выравнивания, но четко прослеживаются консервативные колонки. Все организмы таксономически довольно разнообразны и общей консервативности не наблюдается.