Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score %, Identity %, Similarity Gaps Indels
Fructose-bisphosphate aldolase class 2 ALF_ECOLI ALF_BACSU 279 25,3 41,0 98 16
HTH-type transcriptional regulator CueR CUER_ECOLI CUER_BACSU 78,5 16,8 26,5 92 8
DNA polymerase III subunit delta HOLA_ECOLI HOLA_BACSU 73,0 18,2 33,8 110 19

Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Fructose-bisphosphate aldolase class 2 ALF_ECOLI ALF_BACSU 289.0 27.5 43.2 78 13 88.0% 89.1%
HTH-type transcriptional regulator CueR CUER_ECOLI CUER_BACSU 88.5 26.1 45.0 88.5 4 76.3% 76.9%
DNA polymerase III subunit delta HOLA_ECOLI HOLA_BACSU 92.0 19.5 37.5 66 15 87.8% 89.6%

Комментарии к выравниваниям

Начну сравнение с белков CUER_ECOLI и CUER_BACSU: они сильно расходятся, тк очень маленький процент идентичности, а так же почти 50% от всей последовательности занимают гэпы. Есть несколько очень коротких консервативных участков (например 15-35), которые могут указывать на гомологию. При локальном выравнивании повысилась идентичность и уменьшилось количество гэпов.

Похожая ситуация наблюдается у пары HOLA_ECOLI и HOLA_BACSU. У них схожесть чуть выше, чем у первой пары, но я думаю, что их нельзя считать гомологичными по всей длине. Снова наблюдается низкая идентичность, маленький вес, в этот раз гэпов поменьше, но все равно достаточно много. Явно выраженных гомологичных участков опять нет, только с высокой консервативностью. При локальном выравнивании, как и в первой паре, немного повышается идентичность и вес, уменьшается число гэпов.

А вот ALF_ECOLI и ALF_BACSU уже можно считать гомологичными по всей длине. Можно заметить достаточно большой вес, высокий процент сходства, а так же неплохую идентичность, если сравнивать с предыдущими подопытными. Также не мало участков с консервативными заменами, похожих на гомологичные участки (например, 145-165, 270-290 и тд).

Таким образом, локальное выравнивание информативнее глобального (но не прям чтобы намного), тк оно позволяет выявить гомологичную часть белка.

Результат применения программ выравнивания к неродственным белкам

Таблица 3. Характеристики глобального и локального парного выравнивания пары НЕродственных белков
Algorithm ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
needle NUDE_ECOLI[1] PUCL_BACSU[2] 29.5 7.8 15.1 352 19 - -
water NUDE_ECOLI PUCL_BACSU 51.5 21.7 40.2 25 4 36.0% 18.6%

1. Uric acid degradation bifunctional protein PucL

2. ADP compounds hydrolase NudE

Видно, что все показатели очень низкие. Огромное количество гэпов, некоторые из которыхзанимают целые строки; низкие вес, идентичность, схожесть и процент покрытия в локальном выравнивании. Все это доказывает,что они совершенно негомологичны, хоть в локальном выравнивании и удается определить небольшой консервативный участок.

Множественное выравнивание белков и импорт в Jalview

Мнемоник: ALF

Кол-во результатов поиска на UniProt: 78

Выбранные белки: ALF_RHIME, ALF_DROME, ALF_CANAL, ALF_TRYBB, ALF_SPIOL

Выравнивание делалось с помощью программы Jalview командой "Muscle with Defaults"

Файл с проектом

Я думаю, что выравнивание было не очень удачным, видно достаточно большое количество гэпов. Это могло произойти, потому что для сравнения я выбирала белки из разных царств: в моем выравнивании участвовали белки не только разных бактерий, но и дрозофиллы (Drosophila melanogaster), трипаносомы (Trypanosoma brucei brucei) и шпината (Spinacia oleracea), и они могли давно разойтись. Хотя можно заметить много слабо закрашенных участков и несколько темных колонок с полным совпадением аминокислот.

Более консервативные участки: 60-90, 120-130, 340-370

Менее консервативные участки: 1-10, 15-25, 315-325

Для подтверждения того, что такое выравнивание возникло в результате выборки из разных царств, я сделала дополнительное выравнивание белков, исключая все организмы кроме бактерий. В результате мало что изменилось, и все равно было много консервативных, а не гомологичных участков. Скорее всего, это связано с тем, что я выбирала белки разной длины.

Выравнивание белков бактерий