Kodomo

Пользователь

Практикум 12

Материалы

1. Последовательности генома бактерий:

Escherichia coli str. K-12 substr. MG1655 https://www.ncbi.nlm.nih.gov/nuccore/U00096.3

Candidatus Gracilibacteria bacterium 28_42_T64 https://www.ncbi.nlm.nih.gov/nuccore/CP042461.1

Mycoplasma pneumoniae M29 https://www.ncbi.nlm.nih.gov/nuccore/NZ_CP008895.1

2. Google Colab с кодами к задачам 1-4: https://colab.research.google.com/drive/1BrvNl3WIE8Uv-jD2kHSqlD7mwsi1QuKJ#scrollTo=rms_P4fMBN-u

Задание 1

1. Escherichia coli str. K-12 substr. MG1655

Кодон

Встречаемость кодона (количество)

ATG

3890

ATT

4

CTG

2

GTG

338

TTC

1

TTG

80

2. Candidatus Gracilibacteria bacterium 28_42_T64

Кодон

Встречаемость кодона (количество)

ACA

1

ATG

1129

GTG

41

TCA

1

TCT

1

TTG

23

3. Mycoplasma pneumoniae M29

Кодон

Встречаемость кодона (количество)

AAA

1

ACT

1

ATA

4

ATC

1

ATG

629

ATT

8

CAA

2

CTC

2

CTG

1

GAA

1

GGA

1

GTG

60

GTT

1

TCT

1

TTA

3

TTG

53

Наиболее встречающийся старт-кодон: ATG. Также часто встречаются старт-кодоны GTG и TTG. Так как они отличаются на один нуклеотид от самого распространенного ATG, могут возникать в результате точечных мутаций. Остальные старт-кодоны встречаются редко и с них в большинстве случаев начинаются последовательности псевдогенов. Могут использоваться старт-кодоны отличные от ATG, так как белки, узнающие его, могут также узнавать и другие похожие триплеты, также могло произойти смещение рамки считывания.

Задание 2

lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

Особенность: Последовательность кодирует псевдоген, вероятнее всего произошла мутация и появился стоп кодон не в конце последовательности

lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Особенность: В этих трех последовательностях (представлены выше) кодоном TGA кодируется неканоничная аминокислота селеноцистеин (...[transl_except=(pos:418..420,aa:Sec)]...) . В обычной ситуации TGA это стоп-кодон, но при наличии после него особой последовательности он кодирует селеноцистеин [1].

Задание 3

1. Escherichia coli str. K-12 substr. MG1655

Кодон

Встречаемость кодона (количество)

TGA

1251

TAA

2763

TAG

306

2. Candidatus Gracilibacteria bacterium 28_42_T64

Кодон

Встречаемость кодона (количество)

TGA

1

TAA

1000

TAG

188

3. Mycoplasma pneumoniae M29

Кодон

Встречаемость кодона (количество)

TGA

0

TAA

533

TAG

221

Особенность: У Mycoplasma pneumoniae кодон TGA кодирует триптофан [2]. У Candidatus Gracilibacteria bacterium кодон TGA кодирует глицин [3]

Задание 4

1. Escherichia coli str. K-12 substr. MG1655

Кодон

Встречаемость кодона (количество)

CTA

5203

CTC

14952

CTG

71305

CTT

14728

TTA

18505

TTG

18301

2. Candidatus Gracilibacteria bacterium 28_42_T64

Кодон

Встречаемость кодона (количество)

CTA

3357

CTC

3968

CTG

1714

CTT

9333

TTA

14767

TTG

3237

3. Mycoplasma pneumoniae M29

Кодон

Встречаемость кодона (количество)

CTA

2852

CTC

3139

CTG

2474

CTT

2789

TTA

10308

TTG

5572

Итог: 1) Отличия в частоте кодонов внутри одной бактерии может зависеть от количества определенной тРНК в геноме. 2) Отличия в частоте кодонов между разными бактериями могут зависеть, например, от GC-состава ДНК (при высоком проценте содержания G и C будут преобладать кодоны кодирующие лейцин с G или C в составе).

Литература

1. Zinoni F., Birkmann A., Leinfelder W., Bock A. Cotranslational insertion of selenocysteine into formate dehydrogenase from Escherichia coli directed by a UGA codon (англ.) // Proceedings of the National Academy of Sciences. — National Academy of Sciences, 1987. — Vol. 84, no. 10. — P. 3156—3160. — doi:10.1073/pnas.84.10.3156. — PMID 3033637. — PMC 304827.

2. Guimaraes, Ana M. S., Andrea P. Santos, Phillip SanMiguel, Thomas Walter, Jorge Timenetsky, и Joanne B. Messick. «Complete Genome Sequence of Mycoplasma suis and Insights into Its Biology and Adaption to an Erythrocyte Niche». PLoS ONE 6, вып. 5 (10 май 2011 г.): e19574. https://doi.org/10.1371/journal.pone.0019574.

3. Sieber, Christian M. K., Blair G. Paul, Cindy J. Castelle, Ping Hu, Susannah G. Tringe, David L. Valentine, Gary L. Andersen, и Jillian F. Banfield. «Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community». mBio 10, вып. 6 (12 ноябрь 2019 г.): e02128-19. https://doi.org/10.1128/mBio.02128-19.

Users/kmelnikova/pr12 (последним исправлял пользователь kmelnikova 2023-12-20 21:22:35)