Пракикум 9: Выравнивание последовательностей
Глобальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Putative general secretion pathway protein A* | GSPA_ECOLI | GSPA_BACSU | 58.5 | 13.4% | 23.7% | 146 | 25 |
Cold shock-like protein CspD | CSPD_ECOLI | CSPD_BACSU | 188.0 | 45.9% | 66.2% | 5 | 2 |
High-affinity zinc uptake system membrane protein ZnuB | ZNUB_ECOLI | ZNUB_BACSU | 316.5 | 29.8% | 49.6% | 12 | 6 |
*У Bacillus subtilis (strain 168) белок называется General stress protein A
Локальное парное выравнивание гомологичных белков
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Putative general secretion pathway protein A* | GSPA_ECOLI | GSPA_BACSU | 64.5 | 20.4% | 34.8% | 54 | 19 | 56.44% | 88.11% |
Cold shock-like protein CspD | CSPD_ECOLI | CSPD_BACSU | 188.0 | 52.3% | 73.8% | 1 | 1 | 87.84% | 96.96% |
High-affinity zinc uptake system membrane protein ZnuB | ZNUB_ECOLI | ZNUB_BACSU | 319.0 | 30.4% | 51.5% | 7 | 3 | 99.23% | 95.71% |
*У Bacillus subtilis (strain 168) белок называется General stress protein A
- Немного цифр о том, как считала процент покрытия
- GSPA_ECOLI: (378-103+1)/489*100=56.44%
- GSPA_BACSU: (260-9+1)/286*100=88.11%
- CSPD_ECOLI: (65-1+1)/74*100=87.84%
- CSPD_BACSU: (64-1+1)/66*100=96.96%
- ZNUB_ECOLI: (260-2+1)/261*100=99.23%
- ZNUB_BACSU: (273-6+1)/280*100=95.71%
Результат применения программ выравнивания к неродственным белкам
Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|---|
D-allose transport system permease protein AlsC | Competence transcription factor | ALSC_ECOLI | COMK_BACSU | 10.5 | 1.4% | 2.4% | 235 | 4 |
Protein Name 1 | Protein Name 2 | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|---|
D-allose transport system permease protein AlsC | Competence transcription factor | ALSC_ECOLI | COMK_BACSU | 25.0 | 35.7% | 57.1% | 0 | 0 | 4.29% | 7.29% |
- Немного цифр о том, как считала процент покрытия
- ALSC_ECOLI: (282-269+1)/326*100=4.29%
- COMK_BACSU: (72-59+1)/192*100=7.29%
Исходя из данных глобального исследования, можно сделать вывод, что белки действительно негомологичны:
- Показатель индентичности низкий: 1.4% (<<10%)
- Показатель схожести низкий: 2.4% (<<10%)
- Малый вес выравнивания: 10.5
Данные локального парного выравнивания выглядят намного лучше, но это лишь за счет того, что сравниваются лишь фрагменты исходных последовательностей. На самом деле, по этим данным тоже можно видеть, что белки негомологичны.
- Вес выравнивания мал для подверждения гомологии: 25.0
Множественное выравнивание белков и импорт в Jalview
Решила рассмотреть белки с мнемоникой "CSPD", Cold shock-like protein CspD. По поисковому запросу "(id:CSPD_*)" нашлось 11 белков, из которых 10 из базы Swiss-Prot и один удаленный (demerged) CSPD_ECOLI.
Для анализа, помимо белков CSPD_ECOLI и CSPD_BACSU, взяла следующие белки: CSPD_SHIFL, CSPD_HAEIN, CSPD_BACCE, CSPD_VIBCH, CSPD_BACCR.
Выравнивание выполняла в программе Jalview 2.11.3.2. Колонки были окрашены по цвету индентичности.
Скачать проект Jalview с выравниванием можно по ссылке.
По результатам выравнивания видно, что белки гомологичны. Конечно, они не идентичны, но количество несовпадающих аминокислот не критично, чтобы считать белки негомологичными.