Выравнивание поледовательностей белков кишечной палочки (штамм K12) и сенной палочки (штамм 168)

Выравнивание поледовательностей гомологичных белков

Таблица 1:Характеристики глобального парного выравнивания трёх пар белков

Protein Name ID_1 ID_2 Score % Identity % Similarity Gaps Indels

GTPase Der

DER_ECOLI

DER_BACSU

824.0

36.1 %

56.2 %

60

7

Enoyl-[acyl-carrier-protein] reductase [NADH] FabI

FABI_ECOLI

FABI_BACSU

650.5

50.2 %

67.2 %

10

4

GTPase Era

ERA_ECOLI

ERA_BACSU

600.5

39.3 %

61.6 %

8

600.5

Таблица 1:Характеристики локального парного выравнивания трёх пар белков

Protein Name ID_1 ID_2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2

GTPase Der

DER_ECOLI

DER_BACSU

831.5

38.7%

60.2%

30

3

92.9%

97.9%

Enoyl-[acyl-carrier-protein] reductase [NADH] FabI

FABI_ECOLI

FABI_BACSU

651.5

51.6%

69.0%

4

2

98.5%

99.8%

GTPase Era

ERA_ECOLI

ERA_BACSU

603.5

40.3%

62.7%

4

603.5

97.0%

96.7%

Выравнивание поледовательностей неродственных белков

Таблица 3:Характеристики глобального парного выравнивания неродственных белков

Protein Name_1 Protein Name_2 ID_1 ID_2 Score % Identity % Similarity Gaps Indels

Enoyl-[acyl-carrier-protein] reductase [NADH] FabI

GTPase Era

FABI_ECOLI

ERA_BACSU

33.0

13.5%

21.9%

221

17

Данные белки(FABI_ECOLI b ERA_BACSU) не являются родственными и, как следствие, имеют значительно различающиеся структуры. Менее 15 процентов одинаковых и менее 25 процентов аналогичных аминокислот говорят о том, что эти белки не могут считаться гомологичными. Большое количество indels и gaps указывает на то, что один белок очень маловероятно может быть получен из другого естественным путем.

Таблица 4:Характеристики локального парного выравнивания неродственных белков

Protein Name_1 Protein Name_2 ID_1 ID_2 Score % Identity % Similarity Gaps Indels Coverage 1 Coverage 2

Enoyl-[acyl-carrier-protein] reductase [NADH] FabI

GTPase Era

FABI_ECOLI

ERA_BACSU

45.5

18.0%

29.3%

112

11

91.2%

60.1%

Локальное выравнивание выявило больше, хоть и незначительно, схожести между структурами данных белков. Тем не менее они не гомологичны, количество схожих аминокислот не доходит даже до 30 процентов, а также в выравнивании учтено только 60 процентов первичной структуры второго белка.

Сохранение выравнивания в fasta-формате и импорт в Jalview

Глобальное выравнивание белков DER_ECOLI и DER_BACU в виде проекта Jalview

Множественное выравнивание белков

В базе данных Swiss-Prot было найдено 348 белков, идентификаторы которых начинаются с мнемоники ERA(посчитано в Putty с помошью команды grep -c). Для анализа были выбраны белки с индентификаторами:ERA_MYCSS(Arabidopsis thaliana-Резуховидка Таля), ERA_ARATH(Arabidopsis thaliana),ERA_ORYSJ(Oryza sativa subsp. japonica-Рис посевной), ERA_ECOUT(Escherichia coli (strain UTI89 / UPEC)-Кишечная палочка),ERA_RICCK(Rickettsia canadensis (strain McKiel)-бактерии Риккетсии), а также рассмотренные выше ERA_ECOLI и ERA_BACSU.


Множественное выравнивание белков в виде проекта Jalview


В целом белки имеют очень много различий в структуре. Два белка(ERA_ARATH и ERA_ORYSJ) имеют длину на треть превышающую длину остальных 5 белков, каждый из двух значительно отличается от остальных участком,состоящем примерно из 120 аминокислот и стоящем в начале всей цепи, даныые участки не гомологичны между собой и видимо были приобретены независимо в процессе эволюции. В остальной части выравнивания есть несколько консервативных участков, общих для всех семи белков( по всей видимости эти участки являются функциональными), наиболее крупный такой участок находится между 138 и 194 аминокислотой выравнивания.

Весенний семестр 2018


© Болихова Анастасия 2018