Практикум 9

В этом практикуме было необходимо провести выравнивание белков бектерий Escherichia coli (strain K12) и Bacillus subtilis (strain 168).

1. Глобальное парное выравнивание гомологичных белков

1) Команды для скачивания списка идентификаторов (ID) записей на kodomo:

infoseq 'sw:*_ECOLI' -only -name -nohead -out ECOLI.txt
infoseq 'sw:*_BACSU' -only -name -nohead -out BACSU.txt

Здесь и далее: ID E.coli (strain K12) оканчивается на ECOLI, ID B.subtilis (strain 168) - BACSU.

2) Команды для получения белков с одинаковыми мнемониками функции на kodomo:

cut -f 1 -d '_' ECOLI.txt BACSU.txt | sort | uniq -d > common_mnems.txt

Далее мной случайным образом были выбраны три мнемоники - DEOD, ERA, MURF.

3) Команды на kodomo для нахождения полных имён белков, соответствующих данным мнемоникам (MNEM - обозначение для DEOD, ERA, MURF):

entret sw:MNEM_ECOLI -filter | grep '^DE'
entret sw:MNEM_BACSU -filter | grep '^DE'

4) Команда на kodomo для выполнения глобального выраванивания белков (MNEM - обозначение для DEOD, ERA, MURF):

needle sw:MNEM_ECOLI sw:MNEM_BACSU MNEM.needle -auto

Результаты глобального выраванивания приведены в Таблице 1:

Protein name ID1 ID2 Score % Identity % Similarity Gaps Indels
Purine nucleoside phosphorylase DeoD-type DEOD_ECOLI DEOD_BACSU 692.0 56.10% 73.20% 6 3
GTPase Era ERA_ECOLI ERA_BACSU 600.5 39.30% 61.60% 8 5
UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase MURF_ECOLI MURF_BACSU 619.0 34.70% 52.80% 35 13
Таблица 1. Глобальное выравнивание трёх белков.

2. Локальное парное выравнивание гомологичных белков

1) Команды для локального выравнивания белков (MNEM - обозначение для DEOD, ERA, MURF):

water sw:MNEM_ECOLI sw:MNEM_BACSU MNEM.water -auto

Coverage 1 - для E.coli, Coverage 2 - для B.subtilis.

Protein name ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
Purine nucleoside phosphorylase DeoD-type DEOD_ECOLI DEOD_BACSU 698.0 58.58% 76.00% 1 1 95.82% 97.85%
GTPase Era ERA_ECOLI ERA_BACSU 603.5 40.30% 62.70% 7 4 97.00% 96.68%
UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase MURF_ECOLI MURF_BACSU 623.0 35.00% 53.10% 35 13 99.34% 99.34%
Таблица 2. Локальное выравнивание трёх белков.

3. Результат применения программ выравнивания к неродственным белкам

Случайным образом я выбрала мнемоники ACRF (Multidrug export protein AcrF) из E.coli и ACOR (Acetoin dehydrogenase operon transcriptional activator AcoR) из B.subtilis.

Результаты глобального выравнивания этих белков содержатся в Таблице 3:

ID1 ID2 Score % Identity % Similarity Gaps Indels
ACRF_ECOLI ACOR_BACSU 80.0 11.3% 20.3% 673 36
Таблица 3. Глобальное выравнивание двух белков.

Результаты локального выравнивания расположены в Таблице 4:

Coverage 1 - для E.coli, Coverage 2 - для B.subtilis.

ID1 ID2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2
ACRF_ECOLI ACOR_BACSU 99.5 18.5% 34.0% 207 32 54.93% 89.75%
Таблица 4. Локальное выравнивание двух белков.

4. Множественное выравнивание белков

Для этого задания я выбрала белки с мнемоникой ERA (GTPase Era). В Swiss-Prot обнаружено 349 белков с такой мнемоникой. Кроме ERA_ECOLI и ERA_BACSU, были взяты ERA_THET8, ERA_MYCTA, ERA_ORYSJ, ERA_ARATH, ERA_PSEMY. Множественное выравнивание проводилось с помощью программы Jalview с использованием программы "Muscle with Defaults".

Ссылка на выравнивание.

В результате оказалось, что из всех белков только ERA_ORYSJ и ERA_ARATH оказались наиболее гомологичными. С 1 по 130 столбец выравнивания ERA_ECOLI, ERA_BACSU, ERA_THET8, ERA_PSEMY содержат гэпы. Начиная со 130 столбца, все семь белков имеют больше совпадений аминокислот (участок 140-170 наиболее консервативный во всём выравнивании).