Выравнивание последовательностей


Таблица 1 Характеристики глобального парного выравнивания трёх пар белков при выравнивании программой needle
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
Ribulokinase ARAB_ECOLI ARAB_BACSU 769.0 30.6% 48.7% 56 14
Biotin synthase BIOB_ECOLI BIOB_BACSU 470.0 28.5% 49.1% 69 9
LexA repressor LEXA_ECOLI LEXA_BACSU 296.5 32.7% 51.2% 15 5

Таблица 2 Характеристики локального парного выравнивания трёх пар белков при выравнивании программой water
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Ribulokinase ARAB_ECOLI ARAB_BACSU 776.0 31.9% 50.2% 44 12 97.2% 95.4%
Biotin synthase BIOB_ECOLI BIOB_BACSU 477.5 35.0% 59.9% 6 5 84.7% 86.3%
LexA repressor LEXA_ECOLI LEXA_BACSU 300.5 33.5% 52.4% 13 4 97.5% 98.5%

Результат применения программ выравнивания к неродственным белкам

Таблица 3 характеристики глобального и локального парных выравниваний пары неродственных белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
nonhomologous proteins (needle) MAO1_ECOLI MRAZ_BACSU 31.0 5.6% 8.9% 510 8 - -
nonhomologous proteins (water) MAO1_ECOLI MRAZ_BACSU 49.0 23.5% 37.8% 46 5 15.6% 72.7%

Для негомологичных белков показатели веса, Identity и Similarity низкие, особенно у глобального выравнивания. Количество гэпов в глобальном выравнивании очень большое, в локальным тоже относительно немаленькое. Эти факты свидетельствуют о негомологичности этих белков. При этом лишь малая часть первого белка при локальном выравнивании была покрыта - всего 15.6%, когда как для второго целых 72.7%.


Множественное выравнивание белков

Я нашла в Swiss-Prot все белки для мнемоники LEXA, которая соответсвует белку с рекомендованным полным именем LexA repressor. Таких белков в Swiss-Prot оказалось 447. Для выравнивания помимо LEXA_ECOLI и LEXA_BACSU были выбраны LEXA_PECCC, LEXA_PECAS, LEXA_SHOC1, LEXA1_XANAC и LEXA2_XANAC.

Выравнивание было построено в Jalview с помощью функций Fetch sequences и Alignment с опцией "Muscle with Defaults".

Судя по выравниванию, выбранные белки гомологичны. Программа показала довольно несколько консервативных участков, а именно: 24-69, 91-110, 128-149, 158-164, 167-175. Наиболее длинными менее консервативными участками оказались 11-22, 57-64, 70-90, 106-126, 176-183.

Ссылка на файл с проектом Jalview