Таблица 1. Данные глобального парного выравнивания белковых последовательностей
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
D-3-phosphoglycerate dehydrogenase | SERA_ECOLI | SERA_BACSU | 461 | 21.9 | 39.1 | 161 | 10 |
Xylose isomerase | XYLA_ECOLI | XYLA_BACSU | 1187 | 50.1 | 66.2 | 9 | 3 |
Cell division protein ZapA | ZAPA_ECOLI | ZAPA_BACSU | 41.5 | 13.2 | 29.8 | 48 | 5 |
Таблица 2. Данные локального парного выравнивания белковых последовательностей
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | % Coverage 1 | % Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
D-3-phosphoglycerate dehydrogenase | SERA_ECOLI | SERA_BACSU | 465.5 | 23.2 | 40.6 | 153 | 8 | 89.0 | 94.9 |
Xylose isomerase | XYLA_ECOLI | XYLA_BACSU | 1195 | 51.4 | 67.9 | 2 | 2 | 99.1 | 97.5 |
Cell division protein ZapA | ZAPA_ECOLI | ZAPA_BACSU | 50 | 16.5 | 48.1 | 9 | 3 | 70.6 | 84.7 |
Для выравнивания неродственных белков я взяла пару белков с мнемониками APT(Adenine phosphoribosyltransferase) и BCP(Peroxiredoxin Bcp).
Таблица 3. Данные парного выравнивания
Alignment method | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | % Coverage 1 | % Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
needle | APT_ECOLI | BCP_BACSU | 13 | 1.2 | 2.5 | 306 | 2 | - | - |
water | 28 | 24.6 | 41.0 | 17 | 3 | 33.3 | 28.0 |
Сравнивая выравнивания родственных и неродственных белков, мы видим, что score в первом случае значительно больше, что логично, так как белки образовались от одного предка, следовательно идентичных и похожих аминокислот в них будет больше, чем в неродственных. Если же сравнивать глобальное и локальное выравнивание неродственных белков можно сделать вывод, что с помощью локального выравнивания лучше искать какие-либо похожие участки в неродственных белках (score, проценты идентичных и похожих аминокислот больше ).
Также можно заметить, что некоторые гомологичные белки имеют процент индентичности меньше, чем между неродственными, это можно объяснить тем, что гомологичные белки образовались от общего предка очень давно и успели накопить много мутаций. У негомологичных белков может быть достаточно высокий процент идентичности из-за сходных функций или из-за похожих доменов, связывающих похожие субстраты.
Для множественного выравнивания я выбрала мнемонику XYLA, что соответствует ферменту Xylose isomerase. Всего в Swiss-Prot было найдено 193 таких белков. Далее я выбрала следующие белки: XYLA_PECAS, XYLA_ECOSM, XYLA_THECA, XYLA_BRUA1, XYLA_ECODH. Далее я создала файл xylai.txt со строчками:
sw:XYLA_BACSU
sw:XYLA_ECOLI
sw:XYLA_PECAS
sw:XYLA_ECOSM
sw:XYLA_THECA
sw:XYLA_BRUA1
sw:XYLA_ECODH
Затем я создала файл в формате fasta с помощью команды seqret @xylai.txt xylai.fasta. Затем с помощью команды: muscle -in xylai.fasta -out xyla_alignment.fasta выполнила множественное выравнивание. Далее импортировала выравнивание в Jalview и раскрасила колонки выравнивания по проценту идентичности.Ссылка на файл с проектом Jalview Jalview. В целом, на мой взгляд, белки выровнялись хорошо, видно, что они гомологичные. Присутствуют высококонсервативные участки, например: 189-211; 239-252. Также есть менее консервативные участки: 388-432; 124-141.