Protein Name | ID 1 | ID 2 | Score | %, Identity | %, Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Fructose-bisphosphate aldolase class 2 | ALF_ECOLI | ALF_BACSU | 279 | 25,3 | 41,0 | 98 | 16 |
HTH-type transcriptional regulator CueR | CUER_ECOLI | CUER_BACSU | 78,5 | 16,8 | 26,5 | 92 | 8 |
DNA polymerase III subunit delta | HOLA_ECOLI | HOLA_BACSU | 73,0 | 18,2 | 33,8 | 110 | 19 |
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Fructose-bisphosphate aldolase class 2 | ALF_ECOLI | ALF_BACSU | 289.0 | 27.5 | 43.2 | 78 | 13 | 88.0% | 89.1% |
HTH-type transcriptional regulator CueR | CUER_ECOLI | CUER_BACSU | 88.5 | 26.1 | 45.0 | 88.5 | 4 | 76.3% | 76.9% |
DNA polymerase III subunit delta | HOLA_ECOLI | HOLA_BACSU | 92.0 | 19.5 | 37.5 | 66 | 15 | 87.8% | 89.6% |
Начну сравнение с белков CUER_ECOLI и CUER_BACSU: они сильно расходятся, тк очень маленький процент идентичности, а так же почти 50% от всей последовательности занимают гэпы. Есть несколько очень коротких консервативных участков (например 15-35), которые могут указывать на гомологию. При локальном выравнивании повысилась идентичность и уменьшилось количество гэпов.
Похожая ситуация наблюдается у пары HOLA_ECOLI и HOLA_BACSU. У них схожесть чуть выше, чем у первой пары, но я думаю, что их нельзя считать гомологичными по всей длине. Снова наблюдается низкая идентичность, маленький вес, в этот раз гэпов поменьше, но все равно достаточно много. Явно выраженных гомологичных участков опять нет, только с высокой консервативностью. При локальном выравнивании, как и в первой паре, немного повышается идентичность и вес, уменьшается число гэпов.
А вот ALF_ECOLI и ALF_BACSU уже можно считать гомологичными по всей длине. Можно заметить достаточно большой вес, высокий процент сходства, а так же неплохую идентичность, если сравнивать с предыдущими подопытными. Также не мало участков с консервативными заменами, похожих на гомологичные участки (например, 145-165, 270-290 и тд).
Таким образом, локальное выравнивание информативнее глобального (но не прям чтобы намного), тк оно позволяет выявить гомологичную часть белка.
Algorithm | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
needle | NUDE_ECOLI[1] | PUCL_BACSU[2] | 29.5 | 7.8 | 15.1 | 352 | 19 | - | - |
water | NUDE_ECOLI | PUCL_BACSU | 51.5 | 21.7 | 40.2 | 25 | 4 | 36.0% | 18.6% |
1. Uric acid degradation bifunctional protein PucL
2. ADP compounds hydrolase NudE
Видно, что все показатели очень низкие. Огромное количество гэпов, некоторые из которыхзанимают целые строки; низкие вес, идентичность, схожесть и процент покрытия в локальном выравнивании. Все это доказывает,что они совершенно негомологичны, хоть в локальном выравнивании и удается определить небольшой консервативный участок.
Мнемоник: ALF
Кол-во результатов поиска на UniProt: 78
Выбранные белки: ALF_RHIME, ALF_DROME, ALF_CANAL, ALF_TRYBB, ALF_SPIOL
Выравнивание делалось с помощью программы Jalview командой "Muscle with Defaults"
Я думаю, что выравнивание было не очень удачным, видно достаточно большое количество гэпов. Это могло произойти, потому что для сравнения я выбирала белки из разных царств: в моем выравнивании участвовали белки не только разных бактерий, но и дрозофиллы (Drosophila melanogaster), трипаносомы (Trypanosoma brucei brucei) и шпината (Spinacia oleracea), и они могли давно разойтись. Хотя можно заметить много слабо закрашенных участков и несколько темных колонок с полным совпадением аминокислот.
Более консервативные участки: 60-90, 120-130, 340-370
Менее консервативные участки: 1-10, 15-25, 315-325
Для подтверждения того, что такое выравнивание возникло в результате выборки из разных царств, я сделала дополнительное выравнивание белков, исключая все организмы кроме бактерий. В результате мало что изменилось, и все равно было много консервативных, а не гомологичных участков. Скорее всего, это связано с тем, что я выбирала белки разной длины.