Выравнивание последовательностей

ГЛОБАЛЬНОЕ ПАРНОЕ ВЫРАВНИВАНИЕ ГОМОЛОГИЧНЫХ БЕЛКОВ

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
6-phosphogluconate dehydrogenase, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1718.0 70.0% 83.4% 3 3
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 814.5 51.1% 66.0% 14 4
Putative regulator AbrB ABRB_ECOLI ABRB_BACSU 5.0 0.5% 0.9% 420 2

Рекомендованные полные имена для двух из трех белков различны у E. coli и B. subtilis: первый белок Bacillus несет название 6-phosphogluconate dehydrogenase, NADP(+)-dependent, decarboxylating (6PGD_BACSU), а третий - Transition state regulatory protein AbrB (ABRB_BACSU).

ЛОКАЛЬНОЕ ПАРНОЕ ВЫРАВНИВАНИЕ ГОМОЛОГИЧНЫХ БЕЛКОВ

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
6-phosphogluconate dehydrogenase, decarboxylating 6PGD_ECOLI 6PGD_BACSU 1719.0 70.1% 83.6% 3 3 99.8% 99.8%
Acetyl-coenzyme A carboxylase carboxyl transferase subunit alpha ACCA_ECOLI ACCA_BACSU 823.5 53.8% 69.6% 3 2 97.8% 95.1%
Putative regulator AbrB ABRB_ECOLI ABRB_BACSU 27.0 36.4% 81.8% 0 0 3.2% 11.5%

КОММЕНТАРИИ К ВЫРАВНИВАНИЮ

Основываясь на полученных в результате выравниваний данных, можно сказать, что белки с мнемоникой 6PGD с большой долей вероятности гомологичны. И локальное, и глобальное их выравнивание имеет одинаково высокий Score, процент идентичности и похожести, что говорит о гомологии по всей длине белков. Локальное выравнивание в данном случае не является более информативным, нежели глобальное, так как процент покрытия очень высок и эти выравнивания практически совпадают.

Белки с мнемоникой ACCA рассматриваемых бактерий так же скорее всего гомологичны, наиболее вероятно, по всей длине, за исключением полутора десятков аминокислотных остатков на концах белков. Несмотря на то, что их Score ниже, чем у первой пары белков, он все еще достаточно высок, как и процент похожести и идентичности. Локальное выравнивание опять же не несет значимо больше информации, чем глобальное, из-за высокого покрытия - в него не вошли лишь несколько начальных и концевых аминокислот изучаемых белков.

Последняя пара белков (ABRB), как можно предположить по данным выравнивания, не гомологична. Длины белков различаются более, чем в три раза, а локальное выравнивание, которое в данном случае гораздо информативнее глобального, указывает на наличие гомологичного участка в 11 аминокислот (который, однако, может свидетельствовать о наличии схожего белкового мотива со схожей функцией). Оба вида выравнивания демонстрируют низкий Score и процент идентичности и похожести, а также крайне низкое покрытие. Высокий процент похожести наблюдается для более короткого белка в локальном выравнивании в связи с его небольшой длиной, однако ничего не говорит о полной гомологии на фоне остальных результатов.

РЕЗУЛЬТАТ ПРИМЕНЕНИЯ ПРОГРАММ ВЫРАВНИВАНИЯ К НЕРОДСТВЕННЫМ БЕЛКАМ

Таблица 3. Характеристики глобального и локального парного выравнивания неродственных белков
Alignment type Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Global 28.5 6.0% 13.6% 137 3 100.0% 100.0%
Local 33.0 20.4% 48.1% 3 1 27.1% 82.3%

Для выравнивания был выбран белок E. coli 5'-deoxynucleotidase YfbR (5DNU_ECOLI) и белок B. subtilis 2-hydroxymuconate tautomerase (4OT_BACSU). Оба типа выравниваний ожидаемо имеют примерно одинаково низкий Score, низкий процент идентичности и похожести (последний для более короткого белка близок к 50% из-за его небольшой длины). Локальное выравнивание, тем не менее, несколько информативнее глобального, так как указывает на участок длиной примерно в 65 аминокислот, похожий у данных белков, но с гомологичностью, подвергающейся сомнению.

МНОЖЕСТВЕННОЕ ВЫРАВНИВАНИЕ БЕЛКОВ И ИМПОРТ В JALVIEW

В результате поиска по Swiss-Prot средствами Bash было найдено 54 белка с мнемоникой 6PGD (рекомендованное полное имя белка из ECOLI - 6-phosphogluconate dehydrogenase, decarboxylating). Из них были выбраны, помимо 6PGD_ECOLI и 6PGD_BACSU, также 6PGD_STAEQ, 6PGD_SHEEP, 6PGD_RAOTE, 6PGD_STAAC и 6PGD_SCHPO. Для построения выравнивания был создан списочный файл 6pgd.txt с идентификаторами выбранных белков из Swiss-Prot, с использованием которого командой seqret @6pgd.txt 6pgd.fasta был получен файл в fasta-формате для вышеупомянутых белков. На полученном файле с аминокислотными последовательностями была запущена программа выравнивания muscle командой muscle -align 6pgd.fasta -output 6pgd_alignment.fasta. Итоговый файл с выравниванием был импортирован в Jalview (гиперссылка на файл с проектом Jalview).

Несмотря на таксономическую разрозненность организмов, белки которых были взяты для множественного выравнивания, все из изучаемых ферментов гомологичны практически по всей длине, за исключением некоторых участков. У выравнивания есть выраженная структура, обнаружено много консервативных участков с высокой идентичностью, к примеру, это хорошо заметно на столбцах 15-18, 130-135, 181-201, 262-271, 338-343, 369-374, 442-459. Наименее консервативным участком можно считать конец белка, начиная с 462 столбца выравнивания.