1. Глобальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
D-3-phosphoglycerate dehydrogenase SERA_ECOLI SERA_BACSU 461.0 21.9 39.1 161 9
ATP synthase subunit alpha ATPA_ECOLI ATPA_BACSU 1417.0 54.0 72.0 15 4
Chromosomal replication initiator protein DnaA DNAA_ECOLI DNAA_BACSU 990.0 42.3 61.9 43 9
Таблица 1. Глобальное парное выравнивание гомологичных белков

2. Локальное парное выравнивание гомологичных белков

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
D-3-phosphoglycerate dehydrogenase SERA_ECOLI SERA_BACSU 465.5 23.2 40.6 153 8 89.0 94.9
ATP synthase subunit alpha ATPA_ECOLI ATPA_BACSU 1423.0 54.5 72.5 13 3 99.4 99.0
Chromosomal replication initiator protein DnaA DNAA_ECOLI DNAA_BACSU 994.0 43.6 63.5 33 7 97.2 98.4
Таблица 2. Локальное парное выравнивание гомологичных белков

3. Результат применения программ выравнивания к неродственным белкам

Я выбрала 2 случайных белка с разными мнемониками функций: ALF_ECOLI и CDAS_BACSU.

Protein Name 1 ID 1 Protein Name 2 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Глобальное выравнивание Fructose-bisphosphate aldolase class 2 ALF_ECOLI Cyclic di-AMP synthase CdaS CDAS_BACSU 54.5 10.6 17.3 280 11
Локальное выравнивание Fructose-bisphosphate aldolase class 2 ALF_ECOLI Cyclic di-AMP synthase CdaS CDAS_BACSU 62.5 22.2 35.0 72 9 38.7 94.2
Таблица 3. Локальное и глоабльное парное выравнивание негомологичных белков

Вес выравнивания меньше, чем у гомологичных белков, гораздо больше гэпов. В локальном выравнивании показатели Identity и Similarity примерно вдвое лучше, но все равно относительно малы, что подтверждает негомологичность белков.

4. Множественное выравнивание белков и импорт в Jalview

Я выбрала мнемонику функции ATPA и нашла в Swiss-Prot все белки, чьи идентификаторы начинаются с этой мнемоники. Таких белков оказалось 874. Для множественного выравнивания я выбрала следующие белки:

ATPA_ECOLI - ATP synthase subunit alpha

ATPA_BACSU

ATPA_SACHY

ATPA_MOUSE

ATPA_BUCAP

ATPA_HALOH

ATPA_BACTN

Я сделала выравнивание на сайте Uniprot и скачала его в формате FASTA.

Ссылка на файл с проектом Jalview

У белков выравнивания довольно много консервативных участков. Наиболее длинные из них : 202-220, 247-253, 327-338, 340-355, 402-415. В целом, самая большая схожесть наблюдается в середине выравнивания, а менее консервативные участки располагаются на концах. На концах также имеется много инделей, хотя в середине тоже есть участок с большим количеством гэпов (356-381).

Я думаю, что эти белки действительно гомологичны, так как такое количество совпадений по случайным причинам маловероятно.