Kodomo

Пользователь

Практикум 12

Данные по геному были взяты с сайта Национального Центра Биотехнологической информации (NCBI):

1) Escherichia coli str. K-12 substr. MG1655 https://www.ncbi.nlm.nih.gov/nuccore/U00096.3

2) Candidatus Gracilibacteria bacterium 28_42_T64 https://www.ncbi.nlm.nih.gov/nuccore/CP042461.1

3) Mycoplasma pneumoniae M29 https://www.ncbi.nlm.nih.gov/nuccore/NZ_CP008895.1

Ссылка на Google Colab с кодами для решения заданий: https://colab.research.google.com/drive/1_v10MP8_QUWyuayB6pxs7ZTPoDdwgs06?usp=sharing

Задание 1

Результаты для Escherichia coli:

Старт-кодон

Количество

ATG

3890

ATT

4

CTG

2

GTG

338

TTC

1

TTG

80

Результаты для Candidatus Gracilibacteria:

Старт-кодон

Количество

ACA

1

ATG

1129

GTG

41

TCA

1

TCT

1

TTG

23

Результаты для Mycoplasma pneumoniae:

Старт-кодон

Количество

AAA

1

ACT

1

ATA

4

ATC

1

ATG

629

ATT

8

CAA

2

CTC

2

CTG

1

GAA

1

GGA

1

GTG

60

GTT

1

TCT

1

TTA

3

TTG

53

Результаты:

Преобладающим старт-кодоном для всех трех бактерий является канонический ATG, иногда для инициации трансляции используются GTG и TTG, также очень редко встречаются другие кодоны. Частоту встречаемости кодонов GTG и TTG можно объяснить их сходством с ATG (отличие только в 1 первом нуклеотиде), что означает, что при наличии достаточно сильной последовательности Шайна-Дальгарно(SD) и оптимальной длины спейсера, вероятность инициации трансляции высока. Высокой эффективностью SD и спейсера также можно объяснить инициацию с более редких кодонов. Большинство генов, начинающихся с очень редких старт-кодонов являются псевдогенами, возможно эти старт-кодоны образовались в результате мутаций и отсутствия стабилизирующего отбора.

Задание 2

Кодирующие последовательности E. coli, в которых содержится стоп-кодон не в конце последовательности:

1) >lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

2) >lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

3) >lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

4) >lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Результаты:

1)Одна из CDS, в которой встретился стоп-кодон не в конце, является псевдогеном. Такое положение стоп-кодона может объясняться мутациями и отсутствием стабилизирующего отбора для данной последовательности.

2)Три другие последовательности со стоп-кодонами не только в конце кодируют фермент формиатдегидрогеназу или ее субъединицы. Эти стоп-кодоны кодируют аминокислоту селеноцистеин, которая является лигандом, координирующим ион метала в активном центре фермента.

Задание 3

Результаты для Escherichia coli:

Стоп-кодон

Количество

ATA

1

GAA

1

TAA

2761

TAG

306

TGA

1246

Результаты для Candidatus Gracilibacteria:

Стоп-кодон

Количество

AAA

1

ACA

1

CTT

1

GAA

1

TAA

1000

TAG

188

TCT

2

TGA

1

TTA

1

Результаты для Mycoplasma pneumoniae:

Стоп-кодон

Количество

AAA

1

AAT

1

ACT

1

ATA

1

ATT

1

CCC

1

GAT

1

GGG

4

GGT

1

TAA

533

TAC

1

TAG

221

TAT

1

TTA

1

Результаты:

У первой бактерии присутствуют все 3 стандартные стоп-кодонанта. У двух оставшихся кодон TGA используется очень редко или не используется совсем в качестве стоп-кодона. Он встречается в последовательностях и кодирует аминокислоту, скорее всего для него существует специальная тРНК. В качестве стоп-кодонов иногда используются кодоны, кодирующие аминокислоты в классических случаях, возможно это связано с определёнными последовательностями вокруг этого кодона.

Ссылка на статью:

Swart Е. С. Serra V., Petroni G., Nowacki M. Genetic Codes with No Dedicated Stop Codon Context-Dependent Translation Termination // Cell. 2016. 166. Р. 691-702. doi: 0.1016/j.cell.2016.06.020

Задание 4

Результаты для Escherichia coli:

Кодон

Количество

CTG

71305

TTA

18505

TTG

18301

CTC

14952

CTT

14728

CTA

5203

Результаты для Candidatus Gracilibacteria:

Кодон

Количество

CTG

1714

TTA

14766

TTG

3237

CTC

3968

CTT

9332

CTA

3357

Результаты для Mycoplasma pneumoniae:

Кодон

Количество

CTG

2474

TTA

10307

TTG

5572

CTC

3139

CTT

2789

CTA

2852

Users/timonina/pr12 (последним исправлял пользователь timonina 2023-12-21 18:33:32)