Выравнивались белки из двух организмов: E. coli K12 и Bacillus subtilis (strain 168) с одинаковой мнемоникой функции при помощи утилиты needle из EMBOSS, вызванной с параметрами по умолчанию.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
30S ribosomal protein S19 | RS19_ECOLI | RS19_BACSU | 336.0 | 65.2% | 84.8% | 0 | 0 |
7-cyano-7-deazaguanine synthase | QUEC_ECOLI | QUEC_BACSU | 658.0 | 53.8% | 70.1% | 18 | 5 |
DNA topoisomerase 3 | TOP3_ECOLI | TOP3_BACSU | 884.5 | 29.5% | 44.5% | 148 | 18 |
Далее те же белки были выровнены локально при помощи утилиты water из EMBOSS, вызванной с параметрами по умолчанию.
Protein Name | ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Cover 1 | Cover 2 |
---|---|---|---|---|---|---|---|---|---|
30S ribosomal protein S19 | RS19_ECOLI | RS19_BACSU | 336.0 | 65.2% | 84.8% | 0 | 0 | 100,0% | 100,0% |
7-cyano-7-deazaguanine synthase | QUEC_ECOLI | QUEC_BACSU | 666.0 | 57.4% | 75.0% | 4 | 2 | 93,5% | 96,8% |
DNA topoisomerase 3 | TOP3_ECOLI | TOP3_BACSU | 898.0 | 32.8% | 50.4% | 73 | 16 | 97,5% | 95,0% |
Можно видеть, что вес (score) при локальном выравнивании всегда не ниже, чем при глобальном. Ген рибосомального белка достаточно консервативен, в нём не происходило инсерций и делеций, поэтому оптимальное локальное выравнивание характеризуется стопроцентным покрытием и совпадает с локальным.
В качестве неродственных рассматривались белки с разной мнемоникой функции, выравнивались теми же утилитами.
ID 1 | ID 2 | Score | % Identity | % Similarity | Gaps | Indels | Cover 1 | Cover 2 | Type | |
---|---|---|---|---|---|---|---|---|---|---|
DEAD_ECOLI | LIAR_BACSU | 41.0 | 6.6% | 12.3% | 526 | 15 | global | |||
DEAD_ECOLI | LIAR_BACSU | 55.0 | 18.0% | 40.4% | 54 | 10 | 25,3% | 72,5% | local |
Можно видеть, что уровень идеинтичности и сходства последовательностей гораздо ниже, а гэпов гораздо больше, чем для гомологичных белков. Порядок чисел заставляет предположить, что рассматривавшиеся выше топоизомеразы на самом деле не гомологичны.
Для множественного выравнивания были взяты белки с мнемоникой QUEC (7-cyano-7-deazaguanine synthase). В Swiss-Prot белков с такой мнемоникой 505, из них были выбраны семь со следующими мнемониками организма: ECOLI, BASCU, METMA, GEOSW, OCEIH, ACIAC, STAAT.
Выравнивание производилось при помощи утилиты muscle с параметрами по умолчанию (Muscle with Defaults изнутри Jalview).
Результат можно скачать в виде проекта Jalview, или посмотреть на изображении ниже.
В целом, белки выровнялись нормально и все являются гомологичными. Довольно сильно отличается от остальных QUEC_METMA, что легко объясняется тем, что он принадлежит архее, в то время, как остальные - бактериям.
Наиболее консервативные позиции (одинаковы у всех): 10, 15, 17, 19, 20, 39, 41, 43, 44, 49, 84, 91, 112, 125, 128, 129, 136, 151, 161, 162, 190, 191, 196, 222, 223, 224, 238, 239, 241, 244, 247.
Довольно консервативные позиции (одинаковы как минимум у четырёх, т.е. больше, чем у половины): 9-24, 27-28, 33-34, 37-45, 49-53, 78, 71-72, 76, 78-80, 83-84, 86-87, 91-94, 98-99, 105, 111-112, 123-134, 136-137, 140-143, 145-146, 148-165, 167-170, 172-174, 176-179, 185, 187-194, 196-202, 210, 212, 219-225, 234-236, 237-244, 246-247, 250, 252, 254, 258-259. Часто идут достаточно большими блоками.
Наименее консервативные позиции (совпадают у двух и менее, без учёта гэпов): 25, 30, 36, 47-48, 55, 69-70, 74, 95, 106-107, 109, 137, 146, 180, 182, 195, 217-218, 245, 248, 255, 257, 260.