Выравнивание последовательностей белка



Глобальное парное выравнивание гомологичных белков

Выравнивались белки из двух организмов: E. coli K12 и Bacillus subtilis (strain 168) с одинаковой мнемоникой функции при помощи утилиты needle из EMBOSS, вызванной с параметрами по умолчанию.

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
30S ribosomal protein S19 RS19_ECOLI RS19_BACSU 336.0 65.2% 84.8% 0 0
7-cyano-7-deazaguanine synthase QUEC_ECOLI QUEC_BACSU 658.0 53.8% 70.1% 18 5
DNA topoisomerase 3 TOP3_ECOLI TOP3_BACSU 884.5 29.5% 44.5% 148 18

Локальное парное выравнивание гомологичных белков

Далее те же белки были выровнены локально при помощи утилиты water из EMBOSS, вызванной с параметрами по умолчанию.

Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Cover 1 Cover 2
30S ribosomal protein S19 RS19_ECOLI RS19_BACSU 336.0 65.2% 84.8% 0 0 100,0% 100,0%
7-cyano-7-deazaguanine synthase QUEC_ECOLI QUEC_BACSU 666.0 57.4% 75.0% 4 2 93,5% 96,8%
DNA topoisomerase 3 TOP3_ECOLI TOP3_BACSU 898.0 32.8% 50.4% 73 16 97,5% 95,0%

Можно видеть, что вес (score) при локальном выравнивании всегда не ниже, чем при глобальном. Ген рибосомального белка достаточно консервативен, в нём не происходило инсерций и делеций, поэтому оптимальное локальное выравнивание характеризуется стопроцентным покрытием и совпадает с локальным.


Выравнивание неродственных белков

В качестве неродственных рассматривались белки с разной мнемоникой функции, выравнивались теми же утилитами.

ID 1 ID 2 Score % Identity % Similarity Gaps Indels Cover 1 Cover 2 Type
DEAD_ECOLI LIAR_BACSU 41.0 6.6% 12.3% 526 15 global
DEAD_ECOLI LIAR_BACSU 55.0 18.0% 40.4% 54 10 25,3% 72,5% local

Можно видеть, что уровень идеинтичности и сходства последовательностей гораздо ниже, а гэпов гораздо больше, чем для гомологичных белков. Порядок чисел заставляет предположить, что рассматривавшиеся выше топоизомеразы на самом деле не гомологичны.


Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания были взяты белки с мнемоникой QUEC (7-cyano-7-deazaguanine synthase). В Swiss-Prot белков с такой мнемоникой 505, из них были выбраны семь со следующими мнемониками организма: ECOLI, BASCU, METMA, GEOSW, OCEIH, ACIAC, STAAT.

Выравнивание производилось при помощи утилиты muscle с параметрами по умолчанию (Muscle with Defaults изнутри Jalview).

Результат можно скачать в виде проекта Jalview, или посмотреть на изображении ниже.

В целом, белки выровнялись нормально и все являются гомологичными. Довольно сильно отличается от остальных QUEC_METMA, что легко объясняется тем, что он принадлежит архее, в то время, как остальные - бактериям.

Наиболее консервативные позиции (одинаковы у всех): 10, 15, 17, 19, 20, 39, 41, 43, 44, 49, 84, 91, 112, 125, 128, 129, 136, 151, 161, 162, 190, 191, 196, 222, 223, 224, 238, 239, 241, 244, 247.

Довольно консервативные позиции (одинаковы как минимум у четырёх, т.е. больше, чем у половины): 9-24, 27-28, 33-34, 37-45, 49-53, 78, 71-72, 76, 78-80, 83-84, 86-87, 91-94, 98-99, 105, 111-112, 123-134, 136-137, 140-143, 145-146, 148-165, 167-170, 172-174, 176-179, 185, 187-194, 196-202, 210, 212, 219-225, 234-236, 237-244, 246-247, 250, 252, 254, 258-259. Часто идут достаточно большими блоками.

Наименее консервативные позиции (совпадают у двух и менее, без учёта гэпов): 25, 30, 36, 47-48, 55, 69-70, 74, 95, 106-107, 109, 137, 146, 180, 182, 195, 217-218, 245, 248, 255, 257, 260.