Семестры

Белковое выравнивание

Глобальное выравнивание при помощи алгоритма Нидлмана - Вунша.

При помощи программы needle из пакета программ Emboss были получены три попарные выравнивания белков с одинаковыми мнемониками. Полученные результаты представлены в таблице 1.

Таблица 1. Данные о 3 парных глобальных выравниваниях гомологичных белков Escherichia coli и Bacillus subtilis при помощи алгоритма Нидлмана - Вунша.
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Guanylate kinase kgua_ecoli kgua_bacsu 401.5 41.0 58.1 9 4
Formamidopyrimidine-DNA glycosylase fpg_ecoli fpg_bacsu 486.5 39.5 54.8 17 5
Zinc uptake regulation protein zur_ecoli zur_bacsu 93.0 21.0 33.7 46 9

У Bacillus subtilis и Escherichia coli немного отличаются названия белков с мнемоникой ZUR: у Bacillus subtilis он именуется Zinc-specific metallo-regulatory protein.

Локальное выравнивание при помощи алгоритма Смита - Ватермана.

При помощи программы water из того же пакета были получены три попарные локальные выравнивания белков с одинаковыми мнемониками. Полученные результаты представлены в таблице 2.

Таблица 2. Данные о 3 парных локальных выравниваниях гомологичных белков Escherichia coli и Bacillus subtilis при помощи алгоритма Смита - Ватермана.
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Guanylate kinase kgua_ecoli kgua_bacsu 408.5 42.8 60.7 5 2 96.1% 97.1%
Formamidopyrimidine-DNA glycosylase fpg_ecoli fpg_bacsu 487.5 39.9 55.4 15 4 99.6% 98.9%
Zinc uptake regulation protein zur_ecoli zur_bacsu 104.5 25.0 42.1 14 5 78.9% 90.3%

Обсуждение выравниваний.

Из таблиц 1 и 2 можно заметить, что результаты выравнивания белков с мнемоникой kgua и fpg схожи, а zur отличается. Про первые два белка можно точно сказать, что они гомологичны, так как они достаточно схожи, а локальное выравнивание не сильно увеличивает сумму выравниваний. В целом это же можно сказать и про белок zinc uptake regulation, его локальное выравнивание тоже не сильно меняет результат. Однако в отличие от первых двух, совпадение аминокислот почти в 2 раза хуже, а схожесть отличается не так сильно. Кроме этого, сумма выравнивания в 4 раза меньше чем у первых двух белков.
Из этого можно сделать 2 предположения: либо белки негомологичны и возникли параллельно, либо, что более вероятно, последовательность белка является меннее консервативной, так как небольшие изменения в нем не сильно влияют на жизнеспособность бактерии, из-за чего мутации закрепляются и последовательности, несмотря на гомологичность, отличаются достаточно сильно.

Выравнивание последовательностей негомологичных белков.

Для выраванивания я решил взять гены двух различных типов транспозаз - один из белков, отвечающий за возможность мобильных генетических элементов перемещаться по геному. Результаты представлены в таблицах 3 и 4. Мое предположение заключалось в том, что так как белки негомологичны, их глобальное выравнивание будет "плохое": маленькая сумма и низкий процент идентичности и схожести. Однако локальное выравнивание должно показать лучший результат: так как оба белка взаимодействуют с ДНК у них могут быть схожие аминокислоты для взаимодействия с нуклеиновой кислотой.

Таблица 3. Данные о парном глобальном выравнивании негомологичных белков Escherichia coli при помощи алгоритма Нидлмана - Вунша.
ID 1 ID 2 Score % Identity % Similarity Gaps Indels
IND10_ECOLI INSH1_ECOLI 30.5 8.3 14.3 359 16
Таблица 4. Данные парном локальном выравнивании негомологичных белков Escherichia coli при помощи алгоритма Смита - Ватермана.
ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
IND10_ECOLI INSH1_ECOLI 44.5 20.9 33.2 76 13 41.0% 52.1%

Действительно, локальное выравнивание дало результат лучше, чем глобальное выравнивание. Можно предположить, что участки белков, попавшие в локальное выравнивание, непосредственно принимают участие во взаимодействии ДНК, то есть являются аналогичными приобретениями двух негомологичных белков.

Множественное выравнивание белков.

Проект JalView.
Для глобального выравнивания я выбрал белок formamidopyrimidine-DNA glycosylase (мнемоника fpg). Этот фермент является частью репорационной системы, убирающий окисленные пурины [1]. Так как он связан с ДНК сильные изменения в его структуре могут негативно сказаться на бактерии, так что можно предположить, что его последовательность должна быть достаточно консервативной.
Всего нашлось 451 белков с данной мнемоникой.
Для множественного выравнивания, помимо двух ранее упомянутых бактерий, были совершенно случайно выбраны:

  • HERA2 (Herpetosiphon aurantiacus)
  • ERYLH (Erythrobacter litoralis)
  • AZOC5 (Azorhizobium caulinodans)
  • IDILO (Idiomarina loihiensis)
  • XYLFT (Xylella fastidiosa)
Так получилось, что Herpetosiphon aurantiacus и Bacillus subtilis относятся к кладе Bacillati, в то время как остальные - к кладе Pseudomonadota.
Все последовательности белков выравнялись примерно одинаково. Сильнее всех отличается последовательность принадлежащая Herpetosiphon aurantiacus, как минимум, из-за большей на 20 нуклеотидов длины.
В выравнивании можно выделить несколько консервативных участков, которые, как видимо, являются каталитическими центрами или какими-нибудь другими важными частями этого фермента:
  • 1-9
  • 63-69
  • 81-86
  • 129-134
  • 154-160
  • 190-195
Я думаю, что все белки гомологичны, а наличие каких либо сильных отличий между некоторыми последовательностями обусловлено тем, что организмы слишком дальние родственники.

Список литературы.

[1] Serre L, Pereira de Jésus K, Boiteux S, Zelwer C, Castaing B. Crystal structure of the Lactococcus lactis formamidopyrimidine-DNA glycosylase bound to an abasic site analogue-containing DNA. EMBO J. 2002 Jun 17;21(12):2854-65.