Python. Практикум 13
Задание 1. Частоты старт-кодонов
Escherichia coli:
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1 (Rac prophage; protein LomR_1)
TTG 80
Candidatus Gracilibacteria bacterium:
ACA 1 (hypothetical protein)
ATG 1129
GTG 41
TCA 1 (serine/threonine protein kinase)
TCT 1 (ATP synthase F0 subunit C)
TTG 23
Mycoplasma pneumoniae:
AAA 1 (restriction endonuclease subunit S)
ACA 1 (adhesin P1)
ACT 1 (adhesin P1)
ATA 3
ATC 1 (hypothetical protein)
ATG 627
ATT 7
CAA 1 (adhesin P1)
CAC 1 (adhesin P1)
CTA 1 (MgpC family cytadherence protein)
CTC 3
CTG 2
GAA 1 (DUF16 domain-containing protein)
GTG 60
GTT 1 (cytadherence protein MgpC)
TCC 2
TCT 1 (adhesin P1)
TGA 1 (adhesin P1)
TTA 1 (restriction endonuclease subunit S)
TTC 1 (DUF16 domain-containing protein)
TTG 49
Различные исследования показали, что нестандартные старт-кодоны могут инициировать транскрипцию, однако менее эффективно, чем ATG. Это значит, что если в старт-кодоне какого-то не очень важного гена произойдет мутация, она может не слишком сильно повлиять на выживаемость организма и сохраниться в ходе естественного отбора. Например, с кодона TTC у кишечной палочки начинается ген белка профага, который явно не выполняет какую-либо важную функцию. Вероятно, в нем как-раз произошла нейтральная мутация.
Кроме того, нестандартные кодоны могут использоваться для регуляции экспресии генов. Некоторые транскриционные факторы могут наоборот эффективно взаимодействовать с генами, содержащими нестандартный старт-кодон. Благодаря этому такие гены будут экспрессироваться только в определенных условиях [1].
Наконец, старт-кодон может выполнять какие-то дополнительные важные функции, например, входить в состав сайта связывания. У микоплазмы много нестандартных старт-кодонов в генах адгезина Р1. Это один из главных белков, отвечающих за связывание с поверхностью клетки хозяина. Разные версии этого белка взаимодействуют с различными белками на поверхности клетки. Большое разнообразие адгезинов позволяет избегать скрываться от иммунной системы хозяина (если организм выработал антитела, блокирующие работу одного адгезина, можно проникнуть в клетку с помощью другого). Старт-кодон тоже может участвовать в связывании с белками поверхности [2].
Задание 2. Стоп-кодоны внутри последовательности
Candidatus Gracilibacteria bacterium
Многие последовательности, в которых содержится стоп-кодон не в конце, являются псевдогенами, то есть генами, утратившими свою функцию. В них просто произошли мутации, приведшие к образованию стоп-кодонов. Они не были отброшены в ходе естественного отбора, так как не влияют на выживаемость.
В других случаях стоп-кодоны не являются стоп-кодонами, а кодируют какую-то аминокислоту. У кишечной палочки в генах формиат дегидрогеназы стоп-кодон TGA кодирует необычную и редко используемую аминокислоту селеноцистеин, у которой нет своего кодона [3].
Кроме того, некоторые бактерии имеют нестандартный генетический код. У Candidatus Gracilibacteria bacterium кодон TGA не является стоп-кодоном. Вместо этого он кодирует глицин. Такая же модификация генетического кода наблюдается у некоторых фагов, инфицирующих эту бактерию [4].
У Mycoplasma pneumoniae кодон TGA кодирует аминокислоту триптофан и не является стоп-кодоном [5].
Задание 3. Частоты стоп-кодонов
Escherichia coli
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria bacterium
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae
TGA 0
TAA 526
TAG 220
Редкое использование стоп-кодонов может быть связано с заменой их функции. Вместо стоп-кодона они могут кодировать какую-нибудь аминокислоту.
У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniaeкодон TGA не является стоп-кодоном, а кодирует аминокислоты глицин и триптофан, соответственно, поэтому он редко встречается в конце. Единственный TGA в конце у Candidatus Gracilibacteria bacterium находится в псевдогене. Там он видимо появился в результате нейтральной мутации и не выполняет никаких функций.
Задание 4. Частоты кодонов лейцина
Escherichia coli
TTA 18505
TTC 22229
CTT 14728
CTA 5203
CTC 14952
CTG 71305
Candidatus Gracilibacteria bacterium
TTA 14767
TTC 3504
CTT 9333
CTA 3357
CTC 3968
CTG 1714
Mycoplasma pneumoniae
TTA 10295
TTC 3341
CTT 2782
CTA 2826
CTC 3158
CTG 2470
Частоты использования кодонов зависят от распространенности тРНК, взаимодействующих с этими кодонами и эффективности их взаимодействия. Антикодоны тРНК могут связывать различные кодоны, особенно третий нуклеотид очень сильно варьирует. Однако лучше всего они взаимодействуют с комплиментарными кодонами. В часто экспрессируемых генах большое количество подходящих кодонов позволяет повысить эффективность трансляции, но в редко экспрессируемых это особой роли не играет. Там распределение частот кодонов случайно. Общее распределение частот кодонов в геноме зависит от соотношения в отдельных генах. Кроме того, влияет GC-состав. Чем он больше, тем больше кодонов с G и C [6].
Задание 5. GC-skew
Ссылка на таблицу с графиком GC-skew:
https://docs.google.com/spreadsheets/d/18JWAp5zrE-Xl1Li1WD_EJ4P59s0J4vlyG5X5yGTEpoM/edit?usp=sharing
Минимальное значение соответствует ориджину репликации, максимальное - точке окончания репликации [7].
Задание 6. 6-меры
20 нуклеотидов кишечной палочки
10 наиболее распространенный 6-меров:
Escherichia coli
AAGGAG 183
TAAGGA 163
AGGAGA 129
AAGGAA 122
AAAGGA 120
CAGGAG 120
AGGAGT 113
GGAGAA 104
AGGAAA 101
ACAGGA 94
Candidatus Gracilibacteria bacterium
AAATAA 115
AAAAAA 113
TAAAAA 111
TTTTTT 110
ATAAAA 107
AATAAA 104
ATTTTT 102
AAAAAT 97
TAATAA 93
AATAAT 89
Mycoplasma pneumoniae
AATTAA 44
TTTAAA 40
ATTAAA 37
TTAAAA 35
AAAGGA 33
ATTTAA 32
TAAAAA 29
AATTTA 28
AAGAAA 28
AAAAAG 27
За 5-9 пар нуклеотидов от старт-кодона располагается последовательность Шайна-Дальгарно - место посадки рибосом на мРНК Этот участок взаимодействует с 16S РНК. Консенсус для этой последовательности - AGGAGG, поэтому у кишечной палочки чаще всего встречаются похожие на нее 6-меры.
(Haruichi Asahara, Paula Magnelli, Xiaofeng Shi, Corinna Tuckey, Ying Zhou, James C. Samuelson. Chapter Fifteen - Guidelines for nucleic acid template design for optimal cell-free protein synthesis using an Escherichia coli reconstituted system or a lysate-based system (англ.) // Methods in Enzymology / Zvi Kelman, William B. O'Dell. — Academic Press, 2021-01-01. — Vol. 659. — P. 351–369. — doi:10.1016/bs.mie.2021.07.005).
У большинства бактерий последовательность Шайна-Дальгарно присутствует почти во всех активно-экспрессируемых генах, но встречаются и исключения. У Mycoplasma pneumoniae в гене tuf сайтом связывания рибосомы является последовательность TTAACAACAT. Несмотря на отсутствие последовательности Шайна-Дальгарно, этот ген активно экспрессируется. Его продукт участвует в трансляции, поэтому его последовательность очень консервативна для бактерий.
S Loechel, J M Inamine, P C Hu. A novel translation initiation region from Mycoplasma genitalium that functions in Escherichia coli. // Nucleic Acids Research. — 1991-12-25. — Т. 19, вып. 24. — С. 6905–6911. — ISSN 0305-1048.
Кроме того, у микоплазмы последовательность Шайна-Дальгарно отсутствует у генов 16S РНК [8].
Источники:
1. Xiongwen Cao, Sarah A. Slavoff. Non-AUG start codons: Expanding and regulating the small and alternative ORFeome (англ.) // Experimental Cell Research. — 2020-06. — Vol. 391, iss. 1. — P. 111973. — doi:10.1016/j.yexcr.2020.111973.
2. Michael Widjaja, Iain James Berry, Veronica Maria Jarocki, Matthew Paul Padula, Roger Dumke, Steven Philip Djordjevic. Cell surface processing of the P1 adhesin of Mycoplasma pneumoniae identifies novel domains that bind host molecules (англ.) // Scientific Reports. — 2020-04-14. — Vol. 10, iss. 1. — P. 6384. — ISSN 2045-2322. — doi:10.1038/s41598-020-63136-y.
3. F Zinoni, J Heider, A Böck. Features of the formate dehydrogenase mRNA necessary for decoding of the UGA codon as selenocysteine. (англ.) // Proceedings of the National Academy of Sciences. — 1990-06. — Vol. 87, iss. 12. — P. 4660–4664. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.87.12.4660.
4.Jett Liu, Alexander L. Jaffe, LinXing Chen, Batbileg Bor, Jillian F. Banfield. Host translation machinery is not a barrier to phages that infect both CPR and non-CPR bacteria (англ.). — 2022-11-23. — P. 2022.11.22.517103. — doi:10.1101/2022.11.22.517103.
5. J M Inamine, K C Ho, S Loechel, P C Hu. Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum (англ.) // Journal of Bacteriology. — 1990-01. — Vol. 172, iss. 1. — P. 504–506. — ISSN 1098-5530 0021-9193, 1098-5530. — doi:10.1128/jb.172.1.504-506.1990.
6. Paul M. Sharp, Michele Stenico, John F. Peden, Andrew T. Lloyd. Codon usage: mutational bias, translational selection, or both? // Biochemical Society Transactions. — 1993-11-01. — Т. 21, вып. 4. — С. 835–841. — ISSN 1470-8752 0300-5127, 1470-8752. — doi:10.1042/bst0210835.
7. Kazuharu Arakawa, Masaru Tomita. The GC Skew Index: A Measure of Genomic Compositional Asymmetry and the Degree of Replicational Selection // Evolutionary Bioinformatics Online. — 2007-09-06. — Т. 3. — С. 159–168. — ISSN 1176-9343).
8. Kyungtaek Lim, Yoshikazu Furuta, Ichizo Kobayashi. Large variations in bacterial ribosomal RNA genes // Molecular Biology and Evolution. — 2012-10. — Т. 29, вып. 10. — С. 2937–2948. — ISSN 1537-1719. — doi:10.1093/molbev/mss101.