Были выбраны мнемоники: DEGS_, PURA_, CYSJ_
Выравнивание выполнено программой needle (глобальное парное выравнивание) с параметрами по умолчанию.
Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
| Protein name | ID 1 | ID 2 | Score | % identity | % similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Serine endoprotease DegS | DEGS_ECOLI | DEGS_BACSU | 24,5 | 6,2% | 10,0% | 516 | 14 |
| Adenylosuccinate synthetase | PURA_ECOLI | PURA_BACSU | 992,0 | 45,6% | 63,8% | 6 | 6 |
| Sulfite reductase [NADPH] flavoprotein alpha-component |
CYSJ_ECOLI | CYSJ_BACSU | 1322,5 | 44,1% | 63,1% | 38 | 13 |
Выравнивание выполнено программой water (локальное парное выравнивание) с параметрами по умолчанию.
Таблица 2. Характеристики локального парного выравнивания трёх пар белков
| Protein name | ID 1 | ID 2 | Score | % identity | % similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Serine endoprotease DegS | DEGS_ECOLI | DEGS_BACSU | 36,5 | 26,9% | 41,8% | 13 | 2 | 17,75% | 15,06% |
| Adenylosuccinate synthetase | PURA_ECOLI | PURA_BACSU | 995,0 | 45,9% | 64,3% | 4 | 4 | 99,54% | 99,53% |
| Sulfite reductase [NADPH] flavoprotein alpha-component |
CYSJ_ECOLI | CYSJ_BACSU | 1322,5 | 44,1% | 63,1% | 38 | 13 | 100% | 100% |
Глобальное выравнивание (needle) показало очень низкий процент идентичности (6,2%) и подобия (10,0%), огромное количество гэпов (516) и низкий вес выравнивания (24,5). Это говорит о том, что белки не гомологичны по всей длине. (так как процент идентичности << 25%)
Локальное выравнивание (water) дало значительно лучшие результаты: идентичность 26,9%, подобие 41,8%, всего 13 гэпов и вес 36,5. Покрытие составило 17,75% для E. coli и 15,06% для B. subtilis, что указывает на наличие небольшого консервативного участка, общего для обоих белков. Возможно, это каталитический или функционально важный участок.
Вывод: белки не гомологичны целиком, но имеют небольшой гомологичный участок. Локальное выравнивание в данном случае более информативно, так как оно нашло сходный участок, в то время как глобальное выравнивание не справилось с этой задачей.
Глобальное выравнивание показало хорошие результаты: идентичность 45,6%, подобие 63,8%, всего 6 гэпов, вес 992,0. Поэтому белки можно считать гомологичными (процент идентичности > 25%)
Локальное выравнивание дало очень близкие к глобальному выравниванию результаты: идентичность 45,9%, подобие 64,3%, 4 гэпа, покрытие 99,54% и 99,53%. Это означает, что практически весь белок попал в локальное выравнивание.
Вывод: белки гомологичны по всей длине. Глобальное и локальное выравнивания показали схожие результаты, что подтверждает высокую степень сходства. В данном случае оба типа выравнивания можно считать информативными, но локальное дало незначительно лучший процент идентичности.
Глобальное выравнивание показало идентичность 44,1%, подобие 63,1%, 38 гэпов, вес 1322,5. Так как процент идентичности больше 25% белки можно считать гомологичными по всей длине.
Локальное выравнивание дало идентичность 44,1%, подобие 63,1%, покрытие 100% для обоих белков. Из этого можно сделать вывод, что локальное выравнивание совпало с глобальным, то есть оба выровняли белки по всей длине.
Вывод: белки гомологичны по всей длине. Небольшое количество гэпов (38) может указывать на наличие вставок и делеций в процессе эволюции, которые несильно повлияли на общую структуру белка. Локальное и глобальное выравнивания дали идентичные результаты, так как сходство распределено равномерно по всей длине белка, а не сконцентрировано в отдельный участках.
Были выбраны белки AMN_ECOLI и DHA_BACSU
Таблица 3. Характеристики глобального парного выравнивания неродственных белков
| Protein name 1 | Protein name 2 | ID 1 | ID 2 | Score | % identity | % similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|---|
| AMP nucleosidase | Alanine dehydrogenase | AMN_ECOLI | DHA_BACSU | 23,0 | 13,8% | 21,5% | 280 | 23 |
Таблица 4. Характеристики локального парного выравнивания неродственных белков
| Protein name 1 | Protein name 2 | ID 1 | ID 2 | Score | % identity | % similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|---|
| AMP nucleosidase | Alanine dehydrogenase | AMN_ECOLI | DHA_BACSU | 53,0 | 20,3% | 38,1% | 68 | 10 | 33,88% | 42,86% |
Белки не являются гомологичными, о чём свидетельствуют низкий процент идентичности (13,8% для глобального и 20,3% для локального выравнивания) и большое количество гэпов (280 и 68 соответственно). Глобальное выравнивание оказалось неинформативным, локальное выравнивание показало себя несколько лучше, но в целом оба типа выравнивания не выявили значимого эволюционного сходства между последовательностями.
Для множественного выравнивания я выбрала белки разных организмов с мнемоникой DEGS_. При помощи команды entret sw:DEGS_ECOLI -filter | grep '^DE' было определено рекомендованное полное имя белка из E. coli: Serine endoprotease DegS. Всего нашлось 9 белков с мнемоникой DEGS_ при помощи команды infoseq 'sw:DEGS_*' -only -name -nohead | wc -l.
Из них было выбрано 7 белков:
Для множественного выравнивания белков с мнемоникой DEGS использовалась команда muscle. Сначала с помощью seqret были загружены последовательности из Swiss-Prot, затем выполнено выравнивание командой:
muscle -align degs_all.fasta -output degs_aligned.fasta
Полученный файл выравнивания я открыла в программе Jalview на локальном компьютере, после раскрасила последовательсности в соответствии с процентом идентичности.
Качество выравнивания можно оценить как приемлемое, так как прослеживаются общие участки с идентичными аминокислотами. Однако гомология не является полной — белки сходны лишь на отдельных фрагментах. Например, гомологичные участки обнаружены в колонках 174-190, 232-242, 315-325 и др. Остальные области демонстрируют значительные расхождения, что говорит о вариабельности этих фрагментов у разных организмов. Кроме того, обнаружено, что белки DEGS_CANAL, DEGS_KOMPG и DEGS_SCHPO демонстрируют большее сходство между собой по сравнению с остальными белками. В то же время в последовательностях белков присутствует большое количество гэпов.