Практикум 14
Задание 1
Ниже представлены разновидности старт-кодонов и их количество для каждой из трех бактерий.
*см. код CodonCount
Escherichia coli str. K-12 substr. MG1655
ATG 3890
ATT 4 (proteins)
CTG 2 (proteins)
GTG 338
TTC 1 (pseudogene)
TTG 80
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1 (pseudogene of hypothetical protein)
ATG 1129
GTG 41
TCA 1 (pseudogene)
TCT 1 (pseudogene)
TTG 23
Mycoplasma pneumoniae M29
AAA 1 (pseudogene)
ACT 1 (pseudogene)
ATA 4 (pseudogenes)
ATC 1 (hypothetical protein)
ATG 629
ATT 8 (hypothetical proteins and proteins)
CAA 2
CTC 2 (pseudogenes)
CTG 1 (MFS transporter)
GAA 1 (pseudogene)
GGA 1
GTG 60
GTT 1 (pseudogene)
TCT 1 (pseudogene)
TTA 3 (restriction endonuclease subunit S)
TTG 53
Причины по которым не только ATG может использоваться как старт кодон:
1) Регуляция трансляции: Использование нетипичных старт-кодонов может быть частью механизмов регуляции экспрессии генов. Различные условия окружающей среды или физиологические состояния клетки могут влиять на варианты использования старт-кодонов для контроля уровня продукции белка.
2) РНК-модификации, которые могут изменить способность РНК-полимеразы распознавать привычный старт-кодон.
3) Эпигенетические изменения, такие как метилирование ДНК, которые могут влиять на выбор старт-кодона. *Следующими по количеству встречаемости кодонами после ATG являются GTG и TTG. Они отличаются от привычного нам метионина лишь одним нуклеотидом. В силу этого факта можно назвать GTG и TTG “альтернативными” и утверждать, что они могут появляться в результате точечных мутаций. Остальные кодоны встречаются гораздо реже и чаще всего являются началом гипотетических белков или псевдогенов.
4) Малая субъединица рибосомы может прикрепиться к последовательности мРНК раньше положения стандартного старт кодона, поэтому рамка считывания может сдвинуться.
5) Уникальные биологические функции: Некоторые гены могут специально использовать нетипичные старт-кодоны для осуществления уникальных биологических функций, которые могут потребовать специфической регуляции или экспрессии.
6) Часть последовательности, содержащая ATG или GTG кодоны, может утратиться, поэтому место старт кодонов могут занять следующие за ними кодоны.
Задание 2
*см. код StrangeCodons
Для первой бактерии Escherichia coli str. K-12 substr. MG1655 нужно выбрать те кодирующие последовательности, в которых содержится стоп-кодон не в конце последовательности. Таких последовательностей нашлось 4 штуки.
1.[gene=insN] [protein=IS911A regulator fragment] [pseudo=true]
2. [gene=fdnG] [protein=formate dehydrogenase N subunit alpha]
3. [gene=fdoG] [protein=formate dehydrogenase O subunit alpha]
4. [gene=fdhF] [protein=formate dehydrogenase H]
Мы видим, что в первой последовательности белок не кодируется (псевдоген). Стоп кодон находится не на последнем месте так как рамка считывания сбита, вероятно данный фрагмент являются частью более крупной кодирующей последовательности.
Если же говорить о трех других, то они кодируют Fdh (формиатдегидрогеназы). В них можно найти кодон TGA, который по своей сути является не только стоп-кодоном, но и кодировщиком селеноцистеина.
Основная причина: Стоп-кодон обычно служит сигналом для прекращения трансляции и завершения синтеза белка. Однако, в редких случаях, стоп-кодон может также содержаться внутри гена, приводя к появлению альтернативных форм белков из того же гена. Такие альтернативные формы белков могут возникать в результате использования альтернативных сплайс-вариантов гена или изменений, возникающих на уровне РНК, которые могут приводить к игнорированию стоп-кодона в процессе трансляции. Такие случаи являются редкими и часто связаны с генетическими мутациями или регуляцией экспрессии генов.
Задание 3
В этом задании требовалась посчитать частоты стоп-кодонов и найти “пропавшие”.
*см. код StopCodonCount
Escherichia coli str. K-12 substr. MG1655
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 533
TAG 221
У Candidatus и Mycoplasma “потерянным” стоп кодоном является кодоном является TGA, но если рассмотреть встречаемость этого кодона в геноме бактерий в целом, то у Candidatus и Mycoplasma он встречается огромное количество раз. Вероятно данный кодон кодируют также определенную аминокислоту для каждой из бактерий.
В научных статьях можно найти доказательство этому предположению[1]. Если же рассматривать конкретику, то у Candidatus Gracilibacteria в соответствие кодону TGA ставится глицин, а Mycoplasma pneumoniae триптофан[2-3].
Задание 4
Ищем частоту встречаемости лейцина в каждой из бактерий.
*см. код LeuCodonCount
Escherichia coli str. K-12 substr. MG1655
CTA 8908
CTC 12050
CTG 37912
CTT 14598
TTA 20308
TTG 22788
Total: 116564
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 4388
CTC 3946
CTG 4151
CTT 6743
TTA 12489
TTG 8503
Total: 40220
Mycoplasma pneumoniae M29
CTA 3567
CTC 2088
CTG 2942
CTT 5506
TTA 8581
TTG 6126
Total: 28810
Частоты кодов, кодирующих лейцин, различаются как в пределах одной бактерии, так и между разными.
Различие в частоте использования разных кодонов в пределах одной бактерии может быть обусловлено несколькими факторами:
1. Предпочтительность тРНК: Разные кодоны могут быть связаны с разными типами тРНК, и их частота использования может зависеть от наличия или отсутствия конкретных типов тРНК в клетке.
2. Регуляция экспрессии генов: Некоторые кодоны могут быть предпочтительны для использования в генах, которые активно экспрессируются, в то время как другие кодоны могут быть предпочтительны для генов, экспрессия которых должна быть ингибирована.
3. Мутации: Мутации в ДНК могут приводить к изменению частоты использования определенных кодонов.
4. Для разных бактерий различие в частоте использования кодонов также может быть связано с их геномной составляющей, степенью адаптации к различным условиям окружающей среды, а также с особыми требованиями к экспрессии определенных генов. Таким образом, различия в частоте использования кодонов могут отражать адаптацию бактерий к их среде обитания и функциональные особенности их геномов.
Задание 5
*см. код CumulativeGCSkew
график: https://drive.google.com/file/d/1o8Pz1OSv-_ur978226EVsBUb5YaoS0Lx/view?usp=sharing
Max.GC-skew ставит в себе в соответствие место окончания репликации, т.е. ter-origin, который обычно располагается на отрезке 151100-1516000. На графике имеет значение 47.773 (положение 1513000).
Min.GC-skew ставит в себе в соответствие место начала репликации, т.е. oriC-origin, который обычно располагается на отрезке 326000-392500. На графике имеет значение -28.327 (положение 386900).
Задание 6
Были скачаны файлы в формате genbank(full). Для каждой кодирующей последовательности вырезана последовательность из 20 нуклеотидов до старт-кодона (с учетом ориентации последовательности).
*см. код KmersCount
Escherichia |
AAGGAG 182 |
TAAGGA 160 |
AGGAGA 128 |
AAGGAA 121 |
AAAGGA 120 |
CAGGAG 118 |
AGGAGT 113 |
GGAGAA 104 |
AGGAAA 99 |
ACAGGA 93 |
Campilobacter |
AAATAA 112 |
AAAAAA 111 |
TAAAAA 106 |
ATAAAA 102 |
AATAAA 101 |
TTTTTT 99 |
AAAAAT 91 |
TAATAA 89 |
ATTTTT 88 |
AAAATA 83 |
Mycoplasma |
AATTAA 39 |
TTTAAA 38 |
TTAAAA 34 |
AAAGGA 33 |
ATTAAA 33 |
AAAGGA 33 |
ATAAAA 33 |
ATTTAA 29 |
TAAAAA 29 |
ATTTAA 29 |
За 20 нуклеотидов до старт-кодона находиться последовательность Шайна-Дальгарно, которая отвечает за регуляцию уровня экспрессии генов. Это можно объяснить тем, что это служебная последовательность - , например, она может служить сайтом связывания рибосом. У Escherichia coli наиболее часто встречаются 6-меры, похожие на эту последовательность.
Сопроводительные материалы
[1] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3619370/
[2] Osawa S, Jukes TH, Watanabe K, Muto A. Recent evidence for evolution of the genetic code. Microbiol Rev. 1992 Mar;56(1):229-64. doi: 10.1128/mr.56.1.229-264.1992. PMID: 1579111; PMCID: PMC372862.
[3] Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. Front Microbiol. 2014 May 16;5:231. doi: 10.3389/fmicb.2014.00231. PMID: 24904545; PMCID: PMC4032931.
Коды
Тык на папку: https://drive.google.com/drive/folders/1bvJ2wBpbRA2vgZmxKOAh41lPU1vV_X_i?usp=drive_link