Kodomo

Пользователь

Практикум №12

Выполняя этот практикум были взяты материалы с базы данных NCBI.

Escherichia coli str. K-12 substr. MG1655

Candidatus Gracilibacteria bacterium 28_42_T64

Mycoplasma pneumoniae M29

гены и кодирующие белки

гены и кодирующие белки

гены и кодирующие белки

характеристики генов и их координаты

характеристики генов и их координаты

характеристики генов и их координаты

геном

геном

геном

А также собственные коды: Скрипт на языке Python.

Задание №1

Старт кодон и частота у E. coli:

codon

num

ATG

629

GTG

338

TTG

80

ATT

4

CTG

2

TTC

1

Старт кодон и частота у G. bacterium:

codon

num

ATG

1129

GTG

41

TTG

23

TCT

1

TCA

1

ACA

1

Старт кодон и частота у M. pneumoniae:

codon

num

ATG

629

GTG

60

TTG

53

ATT

8

ATA

4

TTA

3

CTC

2

CAA

2

TCT

1

GTT

1

GGA

1

GAA

1

CTG

1

ATC

1

ACT

1

AAA

1

Задание №2

Гены, стоп-кодоны которых встречается не только в конце ("E. coli"):

1)>lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

2)>lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

3)>lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

4)>lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

Исходя из описания генов, предположим, что ситуация приключилась с первым геном в силу того, что является псевдогеном, и стоп-кодон там появилась из-за мутации(?). В остальных генах не-концевые кодоны кодируют селеноцистеин (C₃H₇NO₂Se).

Задание №3

E. coli:

Стоп-кодон

Частота

TAA

2761

TGA

1246

TAG

306

GAA

1

ATA

1

G. bacterium:

Стоп-кодон

Частота

TAA

1000

TGA

188

TCT

2

TTA

1

ACA

1

AAA

1

TGA

1

GAA

1

CTT

1

M. pneumoniae:

Стоп-кодон

Частота

TAA

533

TAG

221

GGG

4

TAC

1

GGT

1

TTA

1

AAA

1

TAT

1

AAT

1

GAT

1

CCC

1

ATT

1

ATA

1

ACT

1

В геномах Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae очень редко встречается TGA в качестве стоп-кодона. Это говорит о том, что у него, вероятно, есть другая функция. В соответствии с информацией из источника (https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html), TGA в этих организмах часто используется для кодирования аминокислот глицина или триптофана.

Задание №4

E. coli:

Кодон

Частота

CTG

71305

TTA

18505

TTG

18301

CTC

14952

CTT

14728

CTA

5203

G. bacterium:

Кодон

Частота

CTG

1714

TTA

14767

TTG

3237

CTC

3968

CTT

9333

CTA

3357

M. pneumoniae:

Кодон

Частота

CTG

2474

TTA

10308

TTG

5572

CTC

3139

CTT

2789

CTA

2852

У лейцина есть две группы кодонов: малая группа, которые начинаются на TT, и большая группа, которые начинаются на CT. Из таблицы результатов видно, что у E. coli кодоны малой группы встречаются примерно одинаково часто, а вот среди кодонов большой группы один кодон CTG встречается особенно часто. У G. bacterium также есть один кодон, который чаще всего встречается из каждой группы. У M. pneumoniae все кодоны большой группы встречаются примерно одинаково часто, а в группе малых кодонов преобладает кодон TTA.

Такие различия в использовании кодонов могут быть связаны с генетическими мутациями и разными предпочтениями разных организмов. Изменения в генетической информации могут приводить к более или менее частому использованию определенных кодонов. Кроме того, некоторые кодоны могут более сильно связываться с определенными молекулами, что делает их более предпочтительными для использования. Это может быть связано с более эффективной производством определенных белков.

Отклонения в использовании кодонов могут также быть вызваны различиями в генетическом коде разных организмов. Возможно, у этих бактерий существуют некоторые особенности генетического кода, из-за которых редкие кодоны не используются для закодирования лейцина.

Users/yafarova55/pr13 (последним исправлял пользователь yafarova55 2023-12-21 19:05:50)