Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
D-3-phosphoglycerate dehydrogenase | SERA_ECOLI | SERA_BACSU | 461.0 | 21.9 | 39.1 | 161 | 9 |
ATP synthase subunit alpha | ATPA_ECOLI | ATPA_BACSU | 1417.0 | 54.0 | 72.0 | 15 | 4 |
Chromosomal replication initiator protein DnaA | DNAA_ECOLI | DNAA_BACSU | 990.0 | 42.3 | 61.9 | 43 | 9 |
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
D-3-phosphoglycerate dehydrogenase | SERA_ECOLI | SERA_BACSU | 465.5 | 23.2 | 40.6 | 153 | 8 | 89.0 | 94.9 |
ATP synthase subunit alpha | ATPA_ECOLI | ATPA_BACSU | 1423.0 | 54.5 | 72.5 | 13 | 3 | 99.4 | 99.0 |
Chromosomal replication initiator protein DnaA | DNAA_ECOLI | DNAA_BACSU | 994.0 | 43.6 | 63.5 | 33 | 7 | 97.2 | 98.4 |
Я выбрала 2 случайных белка с разными мнемониками функций: ALF_ECOLI и CDAS_BACSU.
Protein Name 1 | ID 1 | Protein Name 2 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 | |
---|---|---|---|---|---|---|---|---|---|---|---|
Глобальное выравнивание | Fructose-bisphosphate aldolase class 2 | ALF_ECOLI | Cyclic di-AMP synthase CdaS | CDAS_BACSU | 54.5 | 10.6 | 17.3 | 280 | 11 | ||
Локальное выравнивание | Fructose-bisphosphate aldolase class 2 | ALF_ECOLI | Cyclic di-AMP synthase CdaS | CDAS_BACSU | 62.5 | 22.2 | 35.0 | 72 | 9 | 38.7 | 94.2 |
Вес выравнивания меньше, чем у гомологичных белков, гораздо больше гэпов. В локальном выравнивании показатели Identity и Similarity примерно вдвое лучше, но все равно относительно малы, что подтверждает негомологичность белков.
Я выбрала мнемонику функции ATPA и нашла в Swiss-Prot все белки, чьи идентификаторы начинаются с этой мнемоники. Таких белков оказалось 874. Для множественного выравнивания я выбрала следующие белки:
ATPA_ECOLI - ATP synthase subunit alpha
ATPA_BACSU
ATPA_SACHY
ATPA_MOUSE
ATPA_BUCAP
ATPA_HALOH
ATPA_BACTN
Я сделала выравнивание на сайте Uniprot и скачала его в формате FASTA.
Ссылка на файл с проектом Jalview
У белков выравнивания довольно много консервативных участков. Наиболее длинные из них : 202-220, 247-253, 327-338, 340-355, 402-415. В целом, самая большая схожесть наблюдается в середине выравнивания, а менее консервативные участки располагаются на концах. На концах также имеется много инделей, хотя в середине тоже есть участок с большим количеством гэпов (356-381).
Я думаю, что эти белки действительно гомологичны, так как такое количество совпадений по случайным причинам маловероятно.