Таблица 1. Характеристики глобального парного выравнивания трёх пар белков (needle, параметры по умолчанию)
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Superoxide dismutase [Mn] | SODM_ECOLI | SODM_BACSU | 639.5 | 58.9% | 66.5% | 10 | 3 |
| Aminodeoxychorismate synthase component 2 | PABA_ECOLI | PABA_BACSU | 640.0 | 58.2% | 77.8% | 7 | 1 |
| Chromosomal replication initiator protein DnaA | DNAA_ECOLI | DNAA_BACSU | 990.0 | 42.3% | 61.9% | 43 | 9 |
Таблица 2. Характеристики локального парного выравнивания трёх пар белков (water, параметры по умолчанию)
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Superoxide dismutase [Mn] | SODM_ECOLI | SODM_BACSU | 639.5 | 59.1% | 66.8% | 8 | 3 | 100.0% | 100.0% |
| Aminodeoxychorismate synthase component 2 | PABA_ECOLI | PABA_BACSU | 641.0 | 61.1% | 81.6% | 0 | 0 | 98.9% | 95.4% |
| Chromosomal replication initiator protein DnaA | DNAA_ECOLI | DNAA_BACSU | 994.0 | 43.6% | 63.5% | 33 | 8 | 97.2% | 98.4% |
1) Белки SODM_ECOLI и SODM_BACSU. Белки гомологичны по всей длине: глобальное выравнивание даёт 58.9% идентичности. Локальное выравнивание покрывает 100% обоих белков, поэтому дополнительной информации не добавляет - результаты практически идентичны. В локальном выравнивании число гэпов (8) меньше, чем в глобальном (10), это, скорее всего, связано с тем, что локальное выравнивание расставляет гэпы иначе, избегая лишних разрывов на концах последовательностей.
2) Белки PABA_ECOLI и PABA_BACSU. Белки гомологичны по всей длине: глобальное выравнивание даёт 58.2% идентичности. Локальное выравнивание покрывает 98.9% и 95.4%, что лишь незначительно меньше 100%, поэтому дополнительной информации практически не добавляет. В локальном выравнивании гэпы отсутствуют (0 против 7), а идентичность выше (61.1% против 58.2%) - это связано с тем, что локальное выравнивание расставляет гэпы иначе и исключает небольшие концевые фрагменты с более низкой гомологией.
3) Белки DNAA_ECOLI и DNAA_BACSU. Белки гомологичны по всей длине: глобальное выравнивание даёт 42.3% идентичности. Локальное выравнивание покрывает 97.2% и 98.4% - почти полностью, поэтому дополнительной информации практически не добавляет. Однако разница в числе гэпов (33 против 43) более выражена, чем у SODM, что связано с наличием у DNAA длинных неконсервативных вставок, которые локальное выравнивание частично исключает.
Таблица 3. Характеристики глобального парного выравнивания пары белков c разными мнемониками функций (needle, параметры по умолчанию)
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
|---|---|---|---|---|---|---|---|
| Bifunctional protein GlmU / Signal peptidase I | GLMU_BACSU | LEP_ECOLI | 19.0 | 6.2% | 11.2% | 472 | 19 |
Таблица 4. Характеристики локального парного выравнивания пары белков c разными мнемониками функций (water, параметры по умолчанию)
| Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
|---|---|---|---|---|---|---|---|---|---|
| Bifunctional protein GlmU | GLMU_BACSU | LEP_ECOLI | 46.0 | 16.0% | 34.0% | 59 | 7 | 30.0% | 39.5% |
Белки негомологичны: при глобальном выравнивании идентичность 6,2% (ниже 20–25%) и 472 гэпа. При локальном выравнивании идентичность выше (16%), но это достигнуто лишь на коротких участках (покрытие 30% и 39,5%), что не свидетельствует об эволюционной связи. Таким образом, в данном случае локальное выравнивание информативнее глобального.
а) Для мнемоники (DNAA_) в Swiss-Prot был произведен поиск белков, начинающихся с этой мнемоники. Их оказалось 575. Полное имя белка: Chromosomal replication initiator protein DnaA. Белки, выбранные для множественного выравнивания (помимо DNAA_BACSU, DNAA_ECOLI): DNAA_MYCTU, DNAA_AQUAE, DNAA_DEIRA, DNAA_STRP2, DNAA_STAA8.
б) Создан списочный файл dnaa.txt с идентификаторами семи белков DnaA, затем он был переведен в формат FASTA через программу seqret, выполнено выравнивание muscle -align dnaa.fasta -output dnaa_aligned.fasta. Результат был импортирован в Jalview, раскрашен по проценту идентичности и сохранён как dnaa.jvp.
в) С множественным выравниванием можно ознакомиться тут
г) Несмотря на наличие гэпов в начале выравнивания, все семь белков можно считать гомологичными благодаря наличию большого числа консервативных участков в их последовательностях (203–210, 213–219, 286–294, 373–378, 475–482).