В этом практикуме было необходимо провести выравнивание белков бектерий Escherichia coli (strain K12) и Bacillus subtilis (strain 168).
1) Команды для скачивания списка идентификаторов (ID) записей на kodomo:
Здесь и далее: ID E.coli (strain K12) оканчивается на ECOLI, ID B.subtilis (strain 168) - BACSU.
2) Команды для получения белков с одинаковыми мнемониками функции на kodomo:
Далее мной случайным образом были выбраны три мнемоники - DEOD, ERA, MURF.
3) Команды на kodomo для нахождения полных имён белков, соответствующих данным мнемоникам (MNEM - обозначение для DEOD, ERA, MURF):
4) Команда на kodomo для выполнения глобального выраванивания белков (MNEM - обозначение для DEOD, ERA, MURF):
Результаты глобального выраванивания приведены в Таблице 1:
Protein name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|---|
Purine nucleoside phosphorylase DeoD-type | DEOD_ECOLI | DEOD_BACSU | 692.0 | 56.10% | 73.20% | 6 | 3 |
GTPase Era | ERA_ECOLI | ERA_BACSU | 600.5 | 39.30% | 61.60% | 8 | 5 |
UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase | MURF_ECOLI | MURF_BACSU | 619.0 | 34.70% | 52.80% | 35 | 13 |
1) Команды для локального выравнивания белков (MNEM - обозначение для DEOD, ERA, MURF):
Coverage 1 - для E.coli, Coverage 2 - для B.subtilis.
Protein name | ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|---|
Purine nucleoside phosphorylase DeoD-type | DEOD_ECOLI | DEOD_BACSU | 698.0 | 58.58% | 76.00% | 1 | 1 | 95.82% | 97.85% |
GTPase Era | ERA_ECOLI | ERA_BACSU | 603.5 | 40.30% | 62.70% | 7 | 4 | 97.00% | 96.68% |
UDP-N-acetylmuramoyl-tripeptide--D-alanyl-D-alanine ligase | MURF_ECOLI | MURF_BACSU | 623.0 | 35.00% | 53.10% | 35 | 13 | 99.34% | 99.34% |
Случайным образом я выбрала мнемоники ACRF (Multidrug export protein AcrF) из E.coli и ACOR (Acetoin dehydrogenase operon transcriptional activator AcoR) из B.subtilis.
Результаты глобального выравнивания этих белков содержатся в Таблице 3:
ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels |
---|---|---|---|---|---|---|
ACRF_ECOLI | ACOR_BACSU | 80.0 | 11.3% | 20.3% | 673 | 36 |
Результаты локального выравнивания расположены в Таблице 4:
Coverage 1 - для E.coli, Coverage 2 - для B.subtilis.
ID1 | ID2 | Score | % Identity | % Similarity | Gaps | Indels | Coverage 1 | Coverage 2 |
---|---|---|---|---|---|---|---|---|
ACRF_ECOLI | ACOR_BACSU | 99.5 | 18.5% | 34.0% | 207 | 32 | 54.93% | 89.75% |
Для этого задания я выбрала белки с мнемоникой ERA (GTPase Era). В Swiss-Prot обнаружено 349 белков с такой мнемоникой. Кроме ERA_ECOLI и ERA_BACSU, были взяты ERA_THET8, ERA_MYCTA, ERA_ORYSJ, ERA_ARATH, ERA_PSEMY. Множественное выравнивание проводилось с помощью программы Jalview с использованием программы "Muscle with Defaults".
Ссылка на выравнивание.В результате оказалось, что из всех белков только ERA_ORYSJ и ERA_ARATH оказались наиболее гомологичными. С 1 по 130 столбец выравнивания ERA_ECOLI, ERA_BACSU, ERA_THET8, ERA_PSEMY содержат гэпы. Начиная со 130 столбца, все семь белков имеют больше совпадений аминокислот (участок 140-170 наиболее консервативный во всём выравнивании).