Практикум 9

Были выбраны мнемоники: DEGS_, PURA_, CYSJ_

Глобальное парное выравнивание гомологичных белков

Выравнивание выполнено программой needle (глобальное парное выравнивание) с параметрами по умолчанию.

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков

Protein name ID 1 ID 2 Score % identity % similarity Gaps Indels
Serine endoprotease DegS DEGS_ECOLI DEGS_BACSU 24,5 6,2% 10,0% 516 14
Adenylosuccinate synthetase PURA_ECOLI PURA_BACSU 992,0 45,6% 63,8% 6 6
Sulfite reductase [NADPH]
flavoprotein alpha-component
CYSJ_ECOLI CYSJ_BACSU 1322,5 44,1% 63,1% 38 13

Локальное парное выравнивание гомологичных белков

Выравнивание выполнено программой water (локальное парное выравнивание) с параметрами по умолчанию.

Таблица 2. Характеристики локального парного выравнивания трёх пар белков

Protein name ID 1 ID 2 Score % identity % similarity Gaps Indels Coverage 1 Coverage 2
Serine endoprotease DegS DEGS_ECOLI DEGS_BACSU 36,5 26,9% 41,8% 13 2 17,75% 15,06%
Adenylosuccinate synthetase PURA_ECOLI PURA_BACSU 995,0 45,9% 64,3% 4 4 99,54% 99,53%
Sulfite reductase [NADPH]
flavoprotein alpha-component
CYSJ_ECOLI CYSJ_BACSU 1322,5 44,1% 63,1% 38 13 100% 100%

Комментарии к выравниваниям

DEGS_ECOLI / DEGS_BACSU (Serine endoprotease DegS)

Глобальное выравнивание (needle) показало очень низкий процент идентичности (6,2%) и подобия (10,0%), огромное количество гэпов (516) и низкий вес выравнивания (24,5). Это говорит о том, что белки не гомологичны по всей длине. (так как процент идентичности << 25%)

Локальное выравнивание (water) дало значительно лучшие результаты: идентичность 26,9%, подобие 41,8%, всего 13 гэпов и вес 36,5. Покрытие составило 17,75% для E. coli и 15,06% для B. subtilis, что указывает на наличие небольшого консервативного участка, общего для обоих белков. Возможно, это каталитический или функционально важный участок.

Вывод: белки не гомологичны целиком, но имеют небольшой гомологичный участок. Локальное выравнивание в данном случае более информативно, так как оно нашло сходный участок, в то время как глобальное выравнивание не справилось с этой задачей.

PURA_ECOLI / PURA_BACSU (Adenylosuccinate synthetase)

Глобальное выравнивание показало хорошие результаты: идентичность 45,6%, подобие 63,8%, всего 6 гэпов, вес 992,0. Поэтому белки можно считать гомологичными (процент идентичности > 25%)

Локальное выравнивание дало очень близкие к глобальному выравниванию результаты: идентичность 45,9%, подобие 64,3%, 4 гэпа, покрытие 99,54% и 99,53%. Это означает, что практически весь белок попал в локальное выравнивание.

Вывод: белки гомологичны по всей длине. Глобальное и локальное выравнивания показали схожие результаты, что подтверждает высокую степень сходства. В данном случае оба типа выравнивания можно считать информативными, но локальное дало незначительно лучший процент идентичности.

CYSJ_ECOLI / CYSJ_BACSU (Sulfite reductase flavoprotein alpha-component)

Глобальное выравнивание показало идентичность 44,1%, подобие 63,1%, 38 гэпов, вес 1322,5. Так как процент идентичности больше 25% белки можно считать гомологичными по всей длине.

Локальное выравнивание дало идентичность 44,1%, подобие 63,1%, покрытие 100% для обоих белков. Из этого можно сделать вывод, что локальное выравнивание совпало с глобальным, то есть оба выровняли белки по всей длине.

Вывод: белки гомологичны по всей длине. Небольшое количество гэпов (38) может указывать на наличие вставок и делеций в процессе эволюции, которые несильно повлияли на общую структуру белка. Локальное и глобальное выравнивания дали идентичные результаты, так как сходство распределено равномерно по всей длине белка, а не сконцентрировано в отдельный участках.

Применение программ выравнивания к неродственным белкам

Были выбраны белки AMN_ECOLI и DHA_BACSU

Таблица 3. Характеристики глобального парного выравнивания неродственных белков

Protein name 1 Protein name 2 ID 1 ID 2 Score % identity % similarity Gaps Indels
AMP nucleosidase Alanine dehydrogenase AMN_ECOLI DHA_BACSU 23,0 13,8% 21,5% 280 23

Таблица 4. Характеристики локального парного выравнивания неродственных белков

Protein name 1 Protein name 2 ID 1 ID 2 Score % identity % similarity Gaps Indels Coverage 1 Coverage 2
AMP nucleosidase Alanine dehydrogenase AMN_ECOLI DHA_BACSU 53,0 20,3% 38,1% 68 10 33,88% 42,86%

Белки не являются гомологичными, о чём свидетельствуют низкий процент идентичности (13,8% для глобального и 20,3% для локального выравнивания) и большое количество гэпов (280 и 68 соответственно). Глобальное выравнивание оказалось неинформативным, локальное выравнивание показало себя несколько лучше, но в целом оба типа выравнивания не выявили значимого эволюционного сходства между последовательностями.

Множественное выравнивание белков

Для множественного выравнивания я выбрала белки разных организмов с мнемоникой DEGS_. При помощи команды entret sw:DEGS_ECOLI -filter | grep '^DE' было определено рекомендованное полное имя белка из E. coli: Serine endoprotease DegS. Всего нашлось 9 белков с мнемоникой DEGS_ при помощи команды infoseq 'sw:DEGS_*' -only -name -nohead | wc -l.

Из них было выбрано 7 белков:

Для множественного выравнивания белков с мнемоникой DEGS использовалась команда muscle. Сначала с помощью seqret были загружены последовательности из Swiss-Prot, затем выполнено выравнивание командой:

muscle -align degs_all.fasta -output degs_aligned.fasta

Полученный файл выравнивания я открыла в программе Jalview на локальном компьютере, после раскрасила последовательсности в соответствии с процентом идентичности.

Качество выравнивания можно оценить как приемлемое, так как прослеживаются общие участки с идентичными аминокислотами. Однако гомология не является полной — белки сходны лишь на отдельных фрагментах. Например, гомологичные участки обнаружены в колонках 174-190, 232-242, 315-325 и др. Остальные области демонстрируют значительные расхождения, что говорит о вариабельности этих фрагментов у разных организмов. Кроме того, обнаружено, что белки DEGS_CANAL, DEGS_KOMPG и DEGS_SCHPO демонстрируют большее сходство между собой по сравнению с остальными белками. В то же время в последовательностях белков присутствует большое количество гэпов.

Проект Jalview