Практикум №12
Выполняя этот практикум были взяты материалы с базы данных NCBI.
Escherichia coli str. K-12 substr. MG1655 |
Candidatus Gracilibacteria bacterium 28_42_T64 |
Mycoplasma pneumoniae M29 |
||
А также собственные коды: Скрипт на языке Python.
Задание №1
Старт кодон и частота у E. coli:
codon |
num |
|
ATG |
629 |
|
GTG |
338 |
|
TTG |
80 |
|
ATT |
4 |
|
CTG |
2 |
|
TTC |
1 |
Старт кодон и частота у G. bacterium:
codon |
num |
|
ATG |
1129 |
|
GTG |
41 |
|
TTG |
23 |
|
TCT |
1 |
|
TCA |
1 |
|
ACA |
1 |
Старт кодон и частота у M. pneumoniae:
codon |
num |
|
ATG |
629 |
|
GTG |
60 |
|
TTG |
53 |
|
ATT |
8 |
|
ATA |
4 |
|
TTA |
3 |
|
CTC |
2 |
|
CAA |
2 |
|
TCT |
1 |
|
GTT |
1 |
|
GGA |
1 |
|
GAA |
1 |
|
CTG |
1 |
|
ATC |
1 |
|
ACT |
1 |
|
AAA |
1 |
Задание №2
Гены, стоп-кодоны которых встречается не только в конце ("E. coli"):
1)>lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
2)>lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
3)>lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
4)>lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
Исходя из описания генов, предположим, что ситуация приключилась с первым геном в силу того, что является псевдогеном, и стоп-кодон там появилась из-за мутации(?). В остальных генах не-концевые кодоны кодируют селеноцистеин (C₃H₇NO₂Se).
Задание №3
E. coli:
Стоп-кодон |
Частота |
|
TAA |
2761 |
|
TGA |
1246 |
|
TAG |
306 |
|
GAA |
1 |
|
ATA |
1 |
G. bacterium:
Стоп-кодон |
Частота |
|
TAA |
1000 |
|
TGA |
188 |
|
TCT |
2 |
|
TTA |
1 |
|
ACA |
1 |
|
AAA |
1 |
|
TGA |
1 |
|
GAA |
1 |
|
CTT |
1 |
M. pneumoniae:
Стоп-кодон |
Частота |
|
TAA |
533 |
|
TAG |
221 |
|
GGG |
4 |
|
TAC |
1 |
|
GGT |
1 |
|
TTA |
1 |
|
AAA |
1 |
|
TAT |
1 |
|
AAT |
1 |
|
GAT |
1 |
|
CCC |
1 |
|
ATT |
1 |
|
ATA |
1 |
|
ACT |
1 |
В геномах Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae очень редко встречается TGA в качестве стоп-кодона. Это говорит о том, что у него, вероятно, есть другая функция. В соответствии с информацией из источника (https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html), TGA в этих организмах часто используется для кодирования аминокислот глицина или триптофана.
Задание №4
E. coli:
Кодон |
Частота |
|
CTG |
71305 |
|
TTA |
18505 |
|
TTG |
18301 |
|
CTC |
14952 |
|
CTT |
14728 |
|
CTA |
5203 |
G. bacterium:
Кодон |
Частота |
|
CTG |
1714 |
|
TTA |
14767 |
|
TTG |
3237 |
|
CTC |
3968 |
|
CTT |
9333 |
|
CTA |
3357 |
M. pneumoniae:
Кодон |
Частота |
|
CTG |
2474 |
|
TTA |
10308 |
|
TTG |
5572 |
|
CTC |
3139 |
|
CTT |
2789 |
|
CTA |
2852 |
У лейцина есть две группы кодонов: малая группа, которые начинаются на TT, и большая группа, которые начинаются на CT. Из таблицы результатов видно, что у E. coli кодоны малой группы встречаются примерно одинаково часто, а вот среди кодонов большой группы один кодон CTG встречается особенно часто. У G. bacterium также есть один кодон, который чаще всего встречается из каждой группы. У M. pneumoniae все кодоны большой группы встречаются примерно одинаково часто, а в группе малых кодонов преобладает кодон TTA.
Такие различия в использовании кодонов могут быть связаны с генетическими мутациями и разными предпочтениями разных организмов. Изменения в генетической информации могут приводить к более или менее частому использованию определенных кодонов. Кроме того, некоторые кодоны могут более сильно связываться с определенными молекулами, что делает их более предпочтительными для использования. Это может быть связано с более эффективной производством определенных белков.
Отклонения в использовании кодонов могут также быть вызваны различиями в генетическом коде разных организмов. Возможно, у этих бактерий существуют некоторые особенности генетического кода, из-за которых редкие кодоны не используются для закодирования лейцина.