Практикум 12
Задание 1. Частота встречаемости старт-кодонов.
Escherichia coli str. K-12 substr. MG1655
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae M29
AAA 1
ACT 1
ATA 4
ATC 1
ATG 629
ATT 8
CAA 2
CTC 2
CTG 1
GAA 1
GGA 1
GTG 60
GTT 1
TCT 1
TTA 3
TTG 53
Больше всего в рассмотренных бактриях встретился старт-кодон ATG. На втором месте кодон GTG, а на третьем TTG. ATG является стандартным старт-кодоном в геномах всех живых организмов, а GTG и TTG могли образоваться в результате мутаций, из-за которых мог измениться один нуклеотид. Другие же найденные и представленные выше старт-кодоны могли стать старт-кодонами по следующим причинам:
1) утеря последовательности с старт-кодоном, из-за чего следущим кодонам пришлось стать старт-кодонами
2) белки и ферменты, которые участвуют в матричном синтезе могут распознавать не только ATG
Задание 2. Стоп-кодоны в последовательности.
"Стоп-кодоны" встречаются всего в 4 последовательностях:
1. [gene=fdnG][locus_tag=b1474][db_xref=UniProtKB/Swiss-Prot:P24183][protein=formatedehydrogenaseNsubunitalpha][transl_except=(pos:586..588,aa:Sec)][protein_id=AAD13438.1][location=1547401..1550448][gbkey=CDS]
2. [gene=insN][locus_tag=b4587][db_xref=ASAP:ABE-0285253,ECOCYC:G6130][protein=IS911Aregulatorfragment][pseudo=true][location=join(270278..270540,271764..272190)][gbkey=CDS]
3. [gene=fdoG][locus_tag=b3894][db_xref=UniProtKB/Swiss-Prot:P32176][protein=formatedehydrogenaseOsubunitalpha][transl_except=(pos:586..588,aa:Sec)][protein_id=AAD13456.1][location=complement(4082772..4085822)][gbkey=CDS]
4. [gene=fdhF][locus_tag=b4079][db_xref=UniProtKB/Swiss-Prot:P07658][protein=formatedehydrogenaseH][transl_except=(pos:418..420,aa:Sec)][protein_id=AAD13462.1][location=complement(4297219..4299366)][gbkey=CDS]
Во второй последовательности видно, что она является псевдогеном, следовательно не кодирует белок. Возможно она является частью большей последовательности. В остальных последовательностях возможно триплетами стоп-кодонов кодируются протеиногенные аминокислоты.
Задание 3. Частоты стоп-кодонов.
Escherichia coli str. K-12 substr. MG1655
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria bacterium 28_42_T64
TGA - 1
TAA - 1000
TAG - 188
Mycoplasma pneumoniae M29
TGA - 0
TAA - 526
TAG – 220
У Escherichia coli str. K-12 substr. MG1655 «потерянный» — TAG. У Candidatus Gracilibacteria bacterium 28_42_T64 и Mycoplasma pneumoniae M29 «потерянным» стоп-кодоном является кодон TGA. Если рассматривать полностью встречаемость этого кодона в геноме, то его гораздо больше. Это может говорить о том, что этот триплет кодирует какую-то аминокислоту.
В литературе можно найти доказательство этому факту: у Candidatus Gracilibacteria bacterium кодону TGA соответствует аминокислота глицин Gly (G) [1], а у Mycoplasma pneumoniae M29 - триптофан [2].
Задание 4. Частота встречаемости кодонов, кодирующих Лейцин.
Escherichia coli str. K-12 substr. MG1655
CTA - 5203
CTC - 14952
CTG - 71305
CTT - 14728
TTA - 18505
TTG - 18301
Candidatus Gracilibacteria bacterium 28_42_T64
CTA - 3357
CTC - 3968
CTG - 1714
CTT - 9333
TTA - 14767
TTG - 3237
Mycoplasma pneumoniae M29
CTA - 2826
CTC - 3158
CTG - 2470
CTT - 2782
TTA - 10295
TTG – 5571
Разница частоты в пределах одной бактерии может быть связано с количеством соответствующих тРНК и степенью экспресси гена. Между разными бактериями на различия может влиять GC-состав.
Задание 5. Cumulative GC-skew Escherichia coli str. K-12 substr. MG1655
Минимум GC-skew cumulative Escherichia coli составил -28.327, а находится он согласно расчету в положении 3869000-3871000. Положению минимума GC-skew соответствует oriC - место, начала репликации и удвоения ДНК. Максимум GC-skew cumulative Escherichia coli составил 47.733, а находится он согласно расчету в положении 1513000. Положению максимума GC-skew соответствует ter - место окончания репликации.
Литература
[1]. Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. Front Microbiol. 2014 May 16;5:231. doi: 10.3389/fmicb.2014.00231. PMID: 24904545; PMCID: PMC4032931.
[2]. Osawa S, Jukes TH, Watanabe K, Muto A. Recent evidence for evolution of the genetic code. Microbiol Rev. 1992 Mar;56(1):229-64. doi: 10.1128/mr.56.1.229-264.1992. PMID: 1579111; PMCID: PMC372862.
Сопроводительные материалы
Все коды тут:
https://colab.research.google.com/drive/1rgZZm8CRMFyyWFJ-vYb-Mkyb3l_43Rfy?usp=sharing