Белковое выравнивание
Глобальное выравнивание при помощи алгоритма Нидлмана - Вунша.
При помощи программы needle из пакета программ Emboss были получены три попарные выравнивания белков с одинаковыми мнемониками. Полученные результаты представлены в таблице 1.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Guanylate kinase | kgua_ecoli | kgua_bacsu | 401.5 | 41.0 | 58.1 | 9 | 4 |
Formamidopyrimidine-DNA glycosylase | fpg_ecoli | fpg_bacsu | 486.5 | 39.5 | 54.8 | 17 | 5 |
Zinc uptake regulation protein | zur_ecoli | zur_bacsu | 93.0 | 21.0 | 33.7 | 46 | 9 |
У Bacillus subtilis и Escherichia coli немного отличаются названия белков с мнемоникой ZUR: у Bacillus subtilis он именуется Zinc-specific metallo-regulatory protein.
Локальное выравнивание при помощи алгоритма Смита - Ватермана.
При помощи программы water из того же пакета были получены три попарные локальные выравнивания белков с одинаковыми мнемониками. Полученные результаты представлены в таблице 2.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Guanylate kinase | kgua_ecoli | kgua_bacsu | 408.5 | 42.8 | 60.7 | 5 | 2 | 96.1% | 97.1% |
Formamidopyrimidine-DNA glycosylase | fpg_ecoli | fpg_bacsu | 487.5 | 39.9 | 55.4 | 15 | 4 | 99.6% | 98.9% |
Zinc uptake regulation protein | zur_ecoli | zur_bacsu | 104.5 | 25.0 | 42.1 | 14 | 5 | 78.9% | 90.3% |
Обсуждение выравниваний.
Из таблиц 1 и 2 можно заметить, что результаты выравнивания белков с мнемоникой kgua и fpg
схожи, а zur отличается. Про первые два белка можно точно сказать, что они гомологичны, так как
они достаточно схожи, а локальное выравнивание не сильно увеличивает сумму выравниваний. В целом
это же можно сказать и про белок zinc uptake regulation, его локальное выравнивание тоже не
сильно меняет результат. Однако в отличие от первых двух, совпадение аминокислот почти в 2 раза
хуже, а схожесть отличается не так сильно. Кроме этого, сумма выравнивания в 4 раза меньше чем
у первых двух белков.
Из этого можно сделать 2 предположения: либо белки негомологичны и возникли параллельно, либо,
что более вероятно, последовательность белка является меннее консервативной, так как небольшие изменения
в нем не сильно влияют на жизнеспособность бактерии, из-за чего мутации закрепляются и последовательности,
несмотря на гомологичность, отличаются достаточно сильно.
Выравнивание последовательностей негомологичных белков.
Для выраванивания я решил взять гены двух различных типов транспозаз - один из белков, отвечающий за возможность мобильных генетических элементов перемещаться по геному. Результаты представлены в таблицах 3 и 4. Мое предположение заключалось в том, что так как белки негомологичны, их глобальное выравнивание будет "плохое": маленькая сумма и низкий процент идентичности и схожести. Однако локальное выравнивание должно показать лучший результат: так как оба белка взаимодействуют с ДНК у них могут быть схожие аминокислоты для взаимодействия с нуклеиновой кислотой.
ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|
IND10_ECOLI | INSH1_ECOLI | 30.5 | 8.3 | 14.3 | 359 | 16 |
ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|
IND10_ECOLI | INSH1_ECOLI | 44.5 | 20.9 | 33.2 | 76 | 13 | 41.0% | 52.1% |
Действительно, локальное выравнивание дало результат лучше, чем глобальное выравнивание. Можно предположить, что участки белков, попавшие в локальное выравнивание, непосредственно принимают участие во взаимодействии ДНК, то есть являются аналогичными приобретениями двух негомологичных белков.
Множественное выравнивание белков.
Проект JalView.
Для глобального выравнивания я выбрал белок formamidopyrimidine-DNA glycosylase (мнемоника fpg). Этот фермент
является частью репорационной системы, убирающий окисленные пурины [1]. Так как он связан с ДНК
сильные изменения в его структуре могут негативно сказаться на бактерии, так что
можно предположить, что его последовательность должна быть достаточно консервативной.
Всего нашлось 451 белков с данной мнемоникой.
Для множественного выравнивания, помимо двух ранее упомянутых бактерий, были совершенно
случайно выбраны:
- HERA2 (Herpetosiphon aurantiacus)
- ERYLH (Erythrobacter litoralis)
- AZOC5 (Azorhizobium caulinodans)
- IDILO (Idiomarina loihiensis)
- XYLFT (Xylella fastidiosa)
Все последовательности белков выравнялись примерно одинаково. Сильнее всех отличается последовательность принадлежащая Herpetosiphon aurantiacus, как минимум, из-за большей на 20 нуклеотидов длины.
В выравнивании можно выделить несколько консервативных участков, которые, как видимо, являются каталитическими центрами или какими-нибудь другими важными частями этого фермента:
- 1-9
- 63-69
- 81-86
- 129-134
- 154-160
- 190-195
Список литературы.
[1] Serre L, Pereira de Jésus K, Boiteux S, Zelwer C, Castaing B. Crystal structure of the Lactococcus lactis formamidopyrimidine-DNA glycosylase bound to an abasic site analogue-containing DNA. EMBO J. 2002 Jun 17;21(12):2854-65.