Kodomo

Пользователь

1 задание: Старт кодоны

E.coli

Кодон

ATG

ATT

CTG

GTG

TTC

TTG

Количество

3890

4

2

338

1

80

Candidatus Gracilibacteria bacterium

Кодон

ACA

ATG

GTG

TCA

TCT

TTG

Количество

1

1129

41

1

1

23

Mycoplasma pneumoniae

Кодон

AAA

ACA

ACT

ATA

ATC

ATG

ATT

CAA

CAC

CTA

CTC

CTG

GAA

GTG

GTT

TCC

TCT

TGA

TTA

TTC

TTG

Количество

1

1

1

3

1

627

7

1

1

1

3

2

1

60

1

2

1

1

1

1

49

Чаще всего встречается старт-кодон ATG, за ним идет GTG и TTG, которые отличаются от стандартного кодона одним нуклеотидом. Скорей всего такие кодоны возникли в результате нуклеотидной замены. Остальные кодоны могли возникнуть также в результате мутации или из-за сдвига рамки считывания. Чаще всего с таких кодонов начинаются последовательности, кодирующие гипотетические белки или же псевдогены. Раз старт-кодонов, отличающихся от стандартного, достаточно много рибосома должна уметь читать последовательность, начиная не только с кодона ATG.

2 задание

E.coli

У E.coli есть 4 последовательности, которые не оканчиваются на стоп-кодоны, но имеют их в середине последовательности. 3 из них кодирую белки формиатдегидрогеназы N, O и H. В этих последовательностях встречается кодон TGA. Скорей всего, он кодирует не стоп-кодон, а аминокислоту селеноцистеин, которая встречается у формиатдегидрогеназы. Последняя же - участок-регулятор. Так как он служит не для синтеза белка, у него могли накапливаться мутации или сбиться рамка считывания.

3 задание: Стоп-кодоны

E.coli

Кодон

TAA

TAG

TGA

Количество

2761

306

1246

Candidatus Gracilibacteria bacterium

Кодон

TAA

TAG

TGA

Количество

1000

188

1

Mycoplasma pneumoniae

Кодон

TAA

TAG

TGA

Количество

526

220

0

У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae на концах теряется стоп-кодон TGA. Однако он встречается в середине последовательностей, что значит, что этот кодон потерял свою функцию стоп-кодоны и, скорей всего, кодирует какую-то аминокислоту. В статье Host translation machinery is not a barrier to phages that infect both CPR and non-CPR bacteria описано, что у Candidatus Gracilibacteria bacterium этот кодон кодирует глицин. В статье High co-expression of TNF-α and CARDS toxin is a good predictor for refractory Mycoplasma pneumoniae pneumonia говориться, что у Mycoplasma pneumoniae TGA кодирует триптофан.

4 задание

E.coli

Кодон

CTT

CTC

CTA

CTG

TTG

TTA

Количество

14728

14952

5203

71305

18301

18505

Candidatus Gracilibacteria bacterium

Кодон

CTT

CTC

CTA

CTG

TTG

TTA

Количество

9333

3968

3357

1714

3237

14767

Mycoplasma pneumoniae

Кодон

CTT

CTC

CTA

CTG

TTG

TTA

Количество

2782

3158

2826

2470

5571

10295

У E.coli чаще всего встречается кодон CTG, у Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae - TTA. Это значит, что по сравнению с другими кодонами они работают более эффективно, то есть они лучше распознаются тРНК бактерий. Возможно, что общий GC-состав генома влияет на частоту встречаемости кодонов, поэтому у разных бактерий разная частота встречаемости кодонов лейцина.

5 задание

Максимум GC-skew соответствует месту конца репликации (ter), а минимум - точке начала (oriC). График У E.coli наименьший cumulative GC-skew - -28.328 на позициях 3870000-3871000. oriC располагается на участке 3925000-326000, что достаточно близко к расчетному месту. Максимальный cumulative GC-skew - 47,733 на позициях 1513000-1514000.

6 задание

E.coli

|| Кодон || Количество||

AAGGAG

1092

TAAGGA

960

AGGAGA

768

AAGGAA

727

AAAGGA

721

CAGGAG

708

AGGAGT

678

GGAGAA

624

AGGAAA

595

ACAGGA

559

Candidatus Gracilibacteria bacterium

Кодон

Количество

AAATAA

91

AATAAA

86

AAAAAA

86

AATAAA

86

AAAAAA

86

TAAAAA

85

ATAAAA

81

TAATAA

73

TAAATA

69

AAAAAT

68

AATAAT

66

TTTTAA

64

Mycoplasma pneumoniae

Кодон

Количество

AATTAA

42

AAAGGA

39

TTTAAA

38

ATTTAA

31

AATTTA

30

ATTAAA

30

AGAAAG

30

AATTTA

30

ATTAAA

30

AGAAAG

30

Последовательность Шайна-Дальгарно - участок связывания рибосом перед старт-кодоном. Возможно состав этой последовательности зависит от общего GC-состава бактерии, так как для E.coli, у которой GC-состав выше, больше последовательностей с гуанином и цитозином, а для Mycoplasma pneumoniae иCandidatus Gracilibacteria bacterium преобладают аденин и тимин.

Коды для заданий

Users/lizyubina/pr13 (последним исправлял пользователь lizyubina 2022-12-22 18:00:26)