Выравнивания последовательностей

Парное выравнивание белков

После скачивания белков Escherichia coli и Bacillus subtilis, средствами электронных таблиц и методом рандомного тыка были выбраны три мнемоники функций: DACB, MURQ, HTPG. Сделаем парные локальные и глобальные выравнивания трех пар гомологичных белков, а также пары неродственных белков и проанализируем результаты:

Белки с мнемоникой DACB, скорее всего, являются негомологичными или подверглись сильной дивергенции. Так как идентичность и схожесть в двух типах выравниваний между DACB_ECOLI и DACB_BACSU даже меньше чем в соответсвующих выравниваниях выбранной пары неродственных белков (MURQ_ECOLI и DACB_BACSU). Характеристики этих четырех выравниваний можно считать вероятностными.

Выравнивания гомологичных пар MURQ и HTPG получились с высокими процентами идентичности и схожести. Если приглядеться к выравниваниям, то можно понять, что локальное и глобальное выравнивание внутри каждой пары получились идентичными (только в локальном выравнивании программа лишь обрезала концы). Это подтверждает гомологичность этих белков.

Таблица 1. Характеристики глобального парного выравнивания трёх пар гомологичных белков и пары неродственных белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
D-alanyl-D-alanine carboxypeptidase DacB DACB_ECOLI DACB_BACSU 26.5 13.1% 23.7% 313 25
N-acetylmuramic acid 6-phosphate etherase MURQ_ECOLI MURQ_BACSU 736.0 46.4% 65.1% 6 2
Chaperone protein HtpG HTPG_ECOLI HTPG_BACSU 1152.0 38.5% 60.6% 34 13
nonhomologous proteins MURQ_ECOLI DACB_BACSU 42.5 15.9% 26.2% 228 23
Таблица 2. Характеристики локального парного выравнивания трёх пар гомологичных белков и пары неродственных белков
Protein Name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
D-alanyl-D-alanine carboxypeptidase DacB DACB_ECOLI DACB_BACSU 53.0 23.7% 35.6% 55 11 39.0% 51.6%
N-acetylmuramic acid 6-phosphate etherase MURQ_ECOLI MURQ_BACSU 739.0 47.6% 66.9% 0 0 99.3% 97.4%
Chaperone protein HtpG HTPG_ECOLI HTPG_BACSU 1154.0 39.0% 61.3% 30 12 98.6% 99.2%
nonhomologous proteins MURQ_ECOLI DACB_BACSU 60.0 29.0% 41.9% 28 6 35.9% 29.6%

Множественное выравнивание белков

Для множественного выравнивания я выбрала мнемонику HTPG, которая соответвует шаперону HtpG (Chaperone protein HtpG). На этот запрос в UniProt нашлось 305 белков в Swiss-Prot и 28,506 в TrEMBL.

Я выбрала семь понравившихся белков из Swiss-Prot, которые принадлежат разным организмам: HTPG_ECOLI, HTPG_BACSU, HTPG_CLOBH, HTPG_YERPE, HTPG_GEOSL, HTPG_HELPY, HTPG_FUSNN. Выравнивание делала в UniProt, потом перенесла его в Jalview и раскрасила колонки по проценту идентичности.

Выравнивание получилось вполне хорошее и в нем прослеживаются консервативные участки. Наиболее крупные из них: 9-45, 70-101, 121-136, 339-359, 623-630. Крупные неконсервативные участки: 185-191, 215-242, 508-537, 605-612.

Множественное выравнивание в Jalview