Kodomo

Пользователь

Практикум 14

Задание 1

Ниже представлены разновидности старт-кодонов и их количество для каждой из трех бактерий.

*см. код CodonCount

Escherichia coli str. K-12 substr. MG1655

ATG 3890

ATT 4 (proteins)

CTG 2 (proteins)

GTG 338

TTC 1 (pseudogene)

TTG 80

Candidatus Gracilibacteria bacterium 28_42_T64

ACA 1 (pseudogene of hypothetical protein)

ATG 1129

GTG 41

TCA 1 (pseudogene)

TCT 1 (pseudogene)

TTG 23

Mycoplasma pneumoniae M29

AAA 1 (pseudogene)

ACT 1 (pseudogene)

ATA 4 (pseudogenes)

ATC 1 (hypothetical protein)

ATG 629

ATT 8 (hypothetical proteins and proteins)

CAA 2

CTC 2 (pseudogenes)

CTG 1 (MFS transporter)

GAA 1 (pseudogene)

GGA 1

GTG 60

GTT 1 (pseudogene)

TCT 1 (pseudogene)

TTA 3 (restriction endonuclease subunit S)

TTG 53

Причины по которым не только ATG может использоваться как старт кодон:

1) Регуляция трансляции: Использование нетипичных старт-кодонов может быть частью механизмов регуляции экспрессии генов. Различные условия окружающей среды или физиологические состояния клетки могут влиять на варианты использования старт-кодонов для контроля уровня продукции белка.

2) РНК-модификации, которые могут изменить способность РНК-полимеразы распознавать привычный старт-кодон.

3) Эпигенетические изменения, такие как метилирование ДНК, которые могут влиять на выбор старт-кодона. *Следующими по количеству встречаемости кодонами после ATG являются GTG и TTG. Они отличаются от привычного нам метионина лишь одним нуклеотидом. В силу этого факта можно назвать GTG и TTG “альтернативными” и утверждать, что они могут появляться в результате точечных мутаций. Остальные кодоны встречаются гораздо реже и чаще всего являются началом гипотетических белков или псевдогенов.

4) Малая субъединица рибосомы может прикрепиться к последовательности мРНК раньше положения стандартного старт кодона, поэтому рамка считывания может сдвинуться.

5) Уникальные биологические функции: Некоторые гены могут специально использовать нетипичные старт-кодоны для осуществления уникальных биологических функций, которые могут потребовать специфической регуляции или экспрессии.

6) Часть последовательности, содержащая ATG или GTG кодоны, может утратиться, поэтому место старт кодонов могут занять следующие за ними кодоны.

Задание 2

*см. код StrangeCodons

Для первой бактерии Escherichia coli str. K-12 substr. MG1655 нужно выбрать те кодирующие последовательности, в которых содержится стоп-кодон не в конце последовательности. Таких последовательностей нашлось 4 штуки.

1.[gene=insN] [protein=IS911A regulator fragment] [pseudo=true]

2. [gene=fdnG] [protein=formate dehydrogenase N subunit alpha]

3. [gene=fdoG] [protein=formate dehydrogenase O subunit alpha]

4. [gene=fdhF] [protein=formate dehydrogenase H]

Мы видим, что в первой последовательности белок не кодируется (псевдоген). Стоп кодон находится не на последнем месте так как рамка считывания сбита, вероятно данный фрагмент являются частью более крупной кодирующей последовательности.

Если же говорить о трех других, то они кодируют Fdh (формиатдегидрогеназы). В них можно найти кодон TGA, который по своей сути является не только стоп-кодоном, но и кодировщиком селеноцистеина.

Основная причина: Стоп-кодон обычно служит сигналом для прекращения трансляции и завершения синтеза белка. Однако, в редких случаях, стоп-кодон может также содержаться внутри гена, приводя к появлению альтернативных форм белков из того же гена. Такие альтернативные формы белков могут возникать в результате использования альтернативных сплайс-вариантов гена или изменений, возникающих на уровне РНК, которые могут приводить к игнорированию стоп-кодона в процессе трансляции. Такие случаи являются редкими и часто связаны с генетическими мутациями или регуляцией экспрессии генов.

Задание 3

В этом задании требовалась посчитать частоты стоп-кодонов и найти “пропавшие”.

*см. код StopCodonCount

Escherichia coli str. K-12 substr. MG1655

TGA 1246

TAA 2761

TAG 306

Candidatus Gracilibacteria bacterium 28_42_T64

TGA 1

TAA 1000

TAG 188

Mycoplasma pneumoniae M29

TGA 0

TAA 533

TAG 221

У Candidatus и Mycoplasma “потерянным” стоп кодоном является кодоном является TGA, но если рассмотреть встречаемость этого кодона в геноме бактерий в целом, то у Candidatus и Mycoplasma он встречается огромное количество раз. Вероятно данный кодон кодируют также определенную аминокислоту для каждой из бактерий.

В научных статьях можно найти доказательство этому предположению[1]. Если же рассматривать конкретику, то у Candidatus Gracilibacteria в соответствие кодону TGA ставится глицин, а Mycoplasma pneumoniae триптофан[2-3].

Задание 4

Ищем частоту встречаемости лейцина в каждой из бактерий.

*см. код LeuCodonCount

Escherichia coli str. K-12 substr. MG1655

CTA 8908

CTC 12050

CTG 37912

CTT 14598

TTA 20308

TTG 22788

Total: 116564

Candidatus Gracilibacteria bacterium 28_42_T64

CTA 4388

CTC 3946

CTG 4151

CTT 6743

TTA 12489

TTG 8503

Total: 40220

Mycoplasma pneumoniae M29

CTA 3567

CTC 2088

CTG 2942

CTT 5506

TTA 8581

TTG 6126

Total: 28810

Частоты кодов, кодирующих лейцин, различаются как в пределах одной бактерии, так и между разными.

Различие в частоте использования разных кодонов в пределах одной бактерии может быть обусловлено несколькими факторами:

1. Предпочтительность тРНК: Разные кодоны могут быть связаны с разными типами тРНК, и их частота использования может зависеть от наличия или отсутствия конкретных типов тРНК в клетке.

2. Регуляция экспрессии генов: Некоторые кодоны могут быть предпочтительны для использования в генах, которые активно экспрессируются, в то время как другие кодоны могут быть предпочтительны для генов, экспрессия которых должна быть ингибирована.

3. Мутации: Мутации в ДНК могут приводить к изменению частоты использования определенных кодонов.

4. Для разных бактерий различие в частоте использования кодонов также может быть связано с их геномной составляющей, степенью адаптации к различным условиям окружающей среды, а также с особыми требованиями к экспрессии определенных генов. Таким образом, различия в частоте использования кодонов могут отражать адаптацию бактерий к их среде обитания и функциональные особенности их геномов.

Задание 5

*см. код CumulativeGCSkew

график: https://drive.google.com/file/d/1o8Pz1OSv-_ur978226EVsBUb5YaoS0Lx/view?usp=sharing

Max.GC-skew ставит в себе в соответствие место окончания репликации, т.е. ter-origin, который обычно располагается на отрезке 151100-1516000. На графике имеет значение 47.773 (положение 1513000).

Min.GC-skew ставит в себе в соответствие место начала репликации, т.е. oriC-origin, который обычно располагается на отрезке 326000-392500. На графике имеет значение -28.327 (положение 386900).

Задание 6

Были скачаны файлы в формате genbank(full). Для каждой кодирующей последовательности вырезана последовательность из 20 нуклеотидов до старт-кодона (с учетом ориентации последовательности).

*см. код KmersCount

Escherichia

AAGGAG 182

TAAGGA 160

AGGAGA 128

AAGGAA 121

AAAGGA 120

CAGGAG 118

AGGAGT 113

GGAGAA 104

AGGAAA 99

ACAGGA 93

Campilobacter

AAATAA 112

AAAAAA 111

TAAAAA 106

ATAAAA 102

AATAAA 101

TTTTTT 99

AAAAAT 91

TAATAA 89

ATTTTT 88

AAAATA 83

Mycoplasma

AATTAA 39

TTTAAA 38

TTAAAA 34

AAAGGA 33

ATTAAA 33

AAAGGA 33

ATAAAA 33

ATTTAA 29

TAAAAA 29

ATTTAA 29

За 20 нуклеотидов до старт-кодона находиться последовательность Шайна-Дальгарно, которая отвечает за регуляцию уровня экспрессии генов. Это можно объяснить тем, что это служебная последовательность - , например, она может служить сайтом связывания рибосом. У Escherichia coli наиболее часто встречаются 6-меры, похожие на эту последовательность.

Сопроводительные материалы

[1] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3619370/

[2] Osawa S, Jukes TH, Watanabe K, Muto A. Recent evidence for evolution of the genetic code. Microbiol Rev. 1992 Mar;56(1):229-64. doi: 10.1128/mr.56.1.229-264.1992. PMID: 1579111; PMCID: PMC372862.

[3] Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. Front Microbiol. 2014 May 16;5:231. doi: 10.3389/fmicb.2014.00231. PMID: 24904545; PMCID: PMC4032931.

Коды

Тык на папку: https://drive.google.com/drive/folders/1bvJ2wBpbRA2vgZmxKOAh41lPU1vV_X_i?usp=drive_link

Users/bratzveron/pr12 (последним исправлял пользователь bratzveron 2023-12-21 16:10:15)