Практикум 12
Материалы
1. Последовательности генома бактерий:
Escherichia coli str. K-12 substr. MG1655 https://www.ncbi.nlm.nih.gov/nuccore/U00096.3
Candidatus Gracilibacteria bacterium 28_42_T64 https://www.ncbi.nlm.nih.gov/nuccore/CP042461.1
Mycoplasma pneumoniae M29 https://www.ncbi.nlm.nih.gov/nuccore/NZ_CP008895.1
2. Google Colab с кодами к задачам 1-4: https://colab.research.google.com/drive/1BrvNl3WIE8Uv-jD2kHSqlD7mwsi1QuKJ#scrollTo=rms_P4fMBN-u
Задание 1
1. Escherichia coli str. K-12 substr. MG1655
Кодон |
Встречаемость кодона (количество) |
ATG |
3890 |
ATT |
4 |
CTG |
2 |
GTG |
338 |
TTC |
1 |
TTG |
80 |
2. Candidatus Gracilibacteria bacterium 28_42_T64
Кодон |
Встречаемость кодона (количество) |
ACA |
1 |
ATG |
1129 |
GTG |
41 |
TCA |
1 |
TCT |
1 |
TTG |
23 |
3. Mycoplasma pneumoniae M29
Кодон |
Встречаемость кодона (количество) |
AAA |
1 |
ACT |
1 |
ATA |
4 |
ATC |
1 |
ATG |
629 |
ATT |
8 |
CAA |
2 |
CTC |
2 |
CTG |
1 |
GAA |
1 |
GGA |
1 |
GTG |
60 |
GTT |
1 |
TCT |
1 |
TTA |
3 |
TTG |
53 |
Наиболее встречающийся старт-кодон: ATG. Также часто встречаются старт-кодоны GTG и TTG. Так как они отличаются на один нуклеотид от самого распространенного ATG, могут возникать в результате точечных мутаций. Остальные старт-кодоны встречаются редко и с них в большинстве случаев начинаются последовательности псевдогенов. Могут использоваться старт-кодоны отличные от ATG, так как белки, узнающие его, могут также узнавать и другие похожие триплеты, также могло произойти смещение рамки считывания.
Задание 2
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS] |
Особенность: Последовательность кодирует псевдоген, вероятнее всего произошла мутация и появился стоп кодон не в конце последовательности
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS] |
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS] |
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS] |
Особенность: В этих трех последовательностях (представлены выше) кодоном TGA кодируется неканоничная аминокислота селеноцистеин (...[transl_except=(pos:418..420,aa:Sec)]...) . В обычной ситуации TGA это стоп-кодон, но при наличии после него особой последовательности он кодирует селеноцистеин [1].
Задание 3
1. Escherichia coli str. K-12 substr. MG1655
Кодон |
Встречаемость кодона (количество) |
TGA |
1251 |
TAA |
2763 |
TAG |
306 |
2. Candidatus Gracilibacteria bacterium 28_42_T64
Кодон |
Встречаемость кодона (количество) |
TGA |
1 |
TAA |
1000 |
TAG |
188 |
3. Mycoplasma pneumoniae M29
Кодон |
Встречаемость кодона (количество) |
TGA |
0 |
TAA |
533 |
TAG |
221 |
Особенность: У Mycoplasma pneumoniae кодон TGA кодирует триптофан [2]. У Candidatus Gracilibacteria bacterium кодон TGA кодирует глицин [3]
Задание 4
1. Escherichia coli str. K-12 substr. MG1655
Кодон |
Встречаемость кодона (количество) |
CTA |
5203 |
CTC |
14952 |
CTG |
71305 |
CTT |
14728 |
TTA |
18505 |
TTG |
18301 |
2. Candidatus Gracilibacteria bacterium 28_42_T64
Кодон |
Встречаемость кодона (количество) |
CTA |
3357 |
CTC |
3968 |
CTG |
1714 |
CTT |
9333 |
TTA |
14767 |
TTG |
3237 |
3. Mycoplasma pneumoniae M29
Кодон |
Встречаемость кодона (количество) |
CTA |
2852 |
CTC |
3139 |
CTG |
2474 |
CTT |
2789 |
TTA |
10308 |
TTG |
5572 |
Итог: 1) Отличия в частоте кодонов внутри одной бактерии может зависеть от количества определенной тРНК в геноме. 2) Отличия в частоте кодонов между разными бактериями могут зависеть, например, от GC-состава ДНК (при высоком проценте содержания G и C будут преобладать кодоны кодирующие лейцин с G или C в составе).
Литература
1. Zinoni F., Birkmann A., Leinfelder W., Bock A. Cotranslational insertion of selenocysteine into formate dehydrogenase from Escherichia coli directed by a UGA codon (англ.) // Proceedings of the National Academy of Sciences. — National Academy of Sciences, 1987. — Vol. 84, no. 10. — P. 3156—3160. — doi:10.1073/pnas.84.10.3156. — PMID 3033637. — PMC 304827.
2. Guimaraes, Ana M. S., Andrea P. Santos, Phillip SanMiguel, Thomas Walter, Jorge Timenetsky, и Joanne B. Messick. «Complete Genome Sequence of Mycoplasma suis and Insights into Its Biology and Adaption to an Erythrocyte Niche». PLoS ONE 6, вып. 5 (10 май 2011 г.): e19574. https://doi.org/10.1371/journal.pone.0019574.
3. Sieber, Christian M. K., Blair G. Paul, Cindy J. Castelle, Ping Hu, Susannah G. Tringe, David L. Valentine, Gary L. Andersen, и Jillian F. Banfield. «Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community». mBio 10, вып. 6 (12 ноябрь 2019 г.): e02128-19. https://doi.org/10.1128/mBio.02128-19.