Практикум 9

Выравнивание последовательностей

1. Глобальное парное выравнивание гомологичных белков

Таблица 1. Характеристики глобального парного выравнивания трёх пар гомологичных белков

Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels
CCA-adding enzyme CCA_ECOLI CCA_BACSU 213.5 22.6 37.5 129 23
L-threonine 3-dehydrogenase TDH_ECOLI TDH_BACSU 844.0 47.1 65.5 8 4
Inactive D-aminoacyl-tRNA deacylase DTD_ECOLI DTD_BACSU 303.0 40.4 58.2 15 2

2. Локальное парное выравнивание гомологичных белков

Таблица 2. Характеристики локального парного выравнивания трёх пар гомологичных белков

Protein name ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
CCA-adding enzyme CCA_ECOLI CCA_BACSU 223.0 24.8 41.5 87 21 90.3% 89.4%
L-threonine 3-dehydrogenase TDH_ECOLI TDH_BACSU 850.0 48.2 67.1 2 2 99.1% 98%
Inactive D-aminoacyl-tRNA deacylase DTD_ECOLI DTD_BACSU 306.0 46.8 66.7 0 0 86.9% 95.5%

3. Результат применения программ выравнивания к неродственным белкам

Для использования программ я выбрала два неродственных белка с разными мнемониками функций: REP_ECOLI (ATP-dependent DNA helicase Rep) и CCRZ_BACSU (Cell cycle regulator CcrZ).

Таблица 3. Характеристики глобального парного выравнивания пары неродственных белков

Protein name 1 Protein name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels
ATP-dependent DNA helicase Rep Cell cycle regulator CcrZ REP_ECOLI CCRZ_BACSU 37.5 7.3 13.2 560 19

В результате глобального выравнивания процент идентичности получился очень низким (7.3%), процент схожести чуть выше - 13.2%, однако такие полученные данные как раз подтвержают то, что белки неродственные. Также количество гэпов может служить доказательством этого. В данном выравнивании их 560 из 751.

Таблица 4. Характеристики локального парного выравнивания пары неродственных белков

Protein name 1 Protein name 2 ID 1 ID 2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
ATP-dependent DNA helicase Rep Cell cycle regulator CcrZ REP_ECOLI CCRZ_BACSU 47.0 22.8 40.1 41 11 24.1% 48.7%

В результате локального выравнивания процент идентичности получился больше - 22.8%, процент схожести тоже - 40.1%(такой процент может наводить на мысли о том, что у выбранных белков есть какое-то сходство в происхождении). Однако этого не достаточно, чтобы считать эти белки родственными. Всё же проценты идентичности и схожести существенно ниже, чем те же данные полученные при выравнивании гомологичных белков.

4. Множественное выравнивание белков и импорт в Jalview

Для множественного выравнивания были выбраны белки с мнемоникой TDH (L-threonine 3-dehydrogenase). Всего UniProt выдал 188 результатов. Для сравнения я взяла белки: TDH_ECOLI, TDH_BACSU, TDH_PSYIN, TDH_SERP5, TDH_SHEWM, TDH_SALPK, TDH_THEKO. Выравнивание делалось с помощью программы Jalview. Был загружен файл с последовательностями всех белков,затем Web Service -> Alignment -> Clustal -> with Defaults. Потом раскрасила колонки по проценту идентичности. С проектом можно ознакомиться по этой ссылке.
picture
Рис.1. Множественное выравнивание
picture
Рис.2. Фрагмент множественного выравнивания

По результатам выравнивания можно сделать вывод, что 6 белков из 7 можно считать гомологичными. Белок TDH_BACSU имеет больше всего неокрашенных участков, а значит, его нельзя назвать гомологичным другим. Есть абсолютно консервативные участки (например: 39-43, 45-47, 153-156 и др.). В самом начале выравнивания стоят несколько гэпов и белок TDH_BACSU опять выделяется, что подтверждает его негомологичность (возможно, это неточность выравнивания).