Kodomo

Пользователь

Python. Практикум 13

Задание 1. Частоты старт-кодонов

Escherichia coli:

ATG 3890

ATT 4

CTG 2

GTG 338

TTC 1 (Rac prophage; protein LomR_1)

TTG 80

Candidatus Gracilibacteria bacterium:

ACA 1 (hypothetical protein)

ATG 1129

GTG 41

TCA 1 (serine/threonine protein kinase)

TCT 1 (ATP synthase F0 subunit C)

TTG 23

Mycoplasma pneumoniae:

AAA 1 (restriction endonuclease subunit S)

ACA 1 (adhesin P1)

ACT 1 (adhesin P1)

ATA 3

ATC 1 (hypothetical protein)

ATG 627

ATT 7

CAA 1 (adhesin P1)

CAC 1 (adhesin P1)

CTA 1 (MgpC family cytadherence protein)

CTC 3

CTG 2

GAA 1 (DUF16 domain-containing protein)

GTG 60

GTT 1 (cytadherence protein MgpC)

TCC 2

TCT 1 (adhesin P1)

TGA 1 (adhesin P1)

TTA 1 (restriction endonuclease subunit S)

TTC 1 (DUF16 domain-containing protein)

TTG 49

Различные исследования показали, что нестандартные старт-кодоны могут инициировать транскрипцию, однако менее эффективно, чем ATG. Это значит, что если в старт-кодоне какого-то не очень важного гена произойдет мутация, она может не слишком сильно повлиять на выживаемость организма и сохраниться в ходе естественного отбора. Например, с кодона TTC у кишечной палочки начинается ген белка профага, который явно не выполняет какую-либо важную функцию. Вероятно, в нем как-раз произошла нейтральная мутация.

Кроме того, нестандартные кодоны могут использоваться для регуляции экспресии генов. Некоторые транскриционные факторы могут наоборот эффективно взаимодействовать с генами, содержащими нестандартный старт-кодон. Благодаря этому такие гены будут экспрессироваться только в определенных условиях [1].

Наконец, старт-кодон может выполнять какие-то дополнительные важные функции, например, входить в состав сайта связывания. У микоплазмы много нестандартных старт-кодонов в генах адгезина Р1. Это один из главных белков, отвечающих за связывание с поверхностью клетки хозяина. Разные версии этого белка взаимодействуют с различными белками на поверхности клетки. Большое разнообразие адгезинов позволяет избегать скрываться от иммунной системы хозяина (если организм выработал антитела, блокирующие работу одного адгезина, можно проникнуть в клетку с помощью другого). Старт-кодон тоже может участвовать в связывании с белками поверхности [2].

Задание 2. Стоп-кодоны внутри последовательности

Escherichia coli

Candidatus Gracilibacteria bacterium

Mycoplasma pneumoniae

Многие последовательности, в которых содержится стоп-кодон не в конце, являются псевдогенами, то есть генами, утратившими свою функцию. В них просто произошли мутации, приведшие к образованию стоп-кодонов. Они не были отброшены в ходе естественного отбора, так как не влияют на выживаемость.

В других случаях стоп-кодоны не являются стоп-кодонами, а кодируют какую-то аминокислоту. У кишечной палочки в генах формиат дегидрогеназы стоп-кодон TGA кодирует необычную и редко используемую аминокислоту селеноцистеин, у которой нет своего кодона [3].

Кроме того, некоторые бактерии имеют нестандартный генетический код. У Candidatus Gracilibacteria bacterium кодон TGA не является стоп-кодоном. Вместо этого он кодирует глицин. Такая же модификация генетического кода наблюдается у некоторых фагов, инфицирующих эту бактерию [4].

У Mycoplasma pneumoniae кодон TGA кодирует аминокислоту триптофан и не является стоп-кодоном [5].

Задание 3. Частоты стоп-кодонов

Escherichia coli

TGA 1246

TAA 2761

TAG 306

Candidatus Gracilibacteria bacterium

TGA 1

TAA 1000

TAG 188

Mycoplasma pneumoniae

TGA 0

TAA 526

TAG 220

Редкое использование стоп-кодонов может быть связано с заменой их функции. Вместо стоп-кодона они могут кодировать какую-нибудь аминокислоту.

У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniaeкодон TGA не является стоп-кодоном, а кодирует аминокислоты глицин и триптофан, соответственно, поэтому он редко встречается в конце. Единственный TGA в конце у Candidatus Gracilibacteria bacterium находится в псевдогене. Там он видимо появился в результате нейтральной мутации и не выполняет никаких функций.

Задание 4. Частоты кодонов лейцина

Escherichia coli

TTA 18505

TTC 22229

CTT 14728

CTA 5203

CTC 14952

CTG 71305

Candidatus Gracilibacteria bacterium

TTA 14767

TTC 3504

CTT 9333

CTA 3357

CTC 3968

CTG 1714

Mycoplasma pneumoniae

TTA 10295

TTC 3341

CTT 2782

CTA 2826

CTC 3158

CTG 2470

Частоты использования кодонов зависят от распространенности тРНК, взаимодействующих с этими кодонами и эффективности их взаимодействия. Антикодоны тРНК могут связывать различные кодоны, особенно третий нуклеотид очень сильно варьирует. Однако лучше всего они взаимодействуют с комплиментарными кодонами. В часто экспрессируемых генах большое количество подходящих кодонов позволяет повысить эффективность трансляции, но в редко экспрессируемых это особой роли не играет. Там распределение частот кодонов случайно. Общее распределение частот кодонов в геноме зависит от соотношения в отдельных генах. Кроме того, влияет GC-состав. Чем он больше, тем больше кодонов с G и C [6].

Задание 5. GC-skew

Ссылка на таблицу с графиком GC-skew:

https://docs.google.com/spreadsheets/d/18JWAp5zrE-Xl1Li1WD_EJ4P59s0J4vlyG5X5yGTEpoM/edit?usp=sharing

Минимальное значение соответствует ориджину репликации, максимальное - точке окончания репликации [7].

Задание 6. 6-меры

20 нуклеотидов кишечной палочки

10 наиболее распространенный 6-меров:

Escherichia coli

AAGGAG 183

TAAGGA 163

AGGAGA 129

AAGGAA 122

AAAGGA 120

CAGGAG 120

AGGAGT 113

GGAGAA 104

AGGAAA 101

ACAGGA 94

Candidatus Gracilibacteria bacterium

AAATAA 115

AAAAAA 113

TAAAAA 111

TTTTTT 110

ATAAAA 107

AATAAA 104

ATTTTT 102

AAAAAT 97

TAATAA 93

AATAAT 89

Mycoplasma pneumoniae

AATTAA 44

TTTAAA 40

ATTAAA 37

TTAAAA 35

AAAGGA 33

ATTTAA 32

TAAAAA 29

AATTTA 28

AAGAAA 28

AAAAAG 27

За 5-9 пар нуклеотидов от старт-кодона располагается последовательность Шайна-Дальгарно - место посадки рибосом на мРНК Этот участок взаимодействует с 16S РНК. Консенсус для этой последовательности - AGGAGG, поэтому у кишечной палочки чаще всего встречаются похожие на нее 6-меры.

(Haruichi Asahara, Paula Magnelli, Xiaofeng Shi, Corinna Tuckey, Ying Zhou, James C. Samuelson. Chapter Fifteen - Guidelines for nucleic acid template design for optimal cell-free protein synthesis using an Escherichia coli reconstituted system or a lysate-based system (англ.) // Methods in Enzymology / Zvi Kelman, William B. O'Dell. — Academic Press, 2021-01-01. — Vol. 659. — P. 351–369. — doi:10.1016/bs.mie.2021.07.005).

У большинства бактерий последовательность Шайна-Дальгарно присутствует почти во всех активно-экспрессируемых генах, но встречаются и исключения. У Mycoplasma pneumoniae в гене tuf сайтом связывания рибосомы является последовательность TTAACAACAT. Несмотря на отсутствие последовательности Шайна-Дальгарно, этот ген активно экспрессируется. Его продукт участвует в трансляции, поэтому его последовательность очень консервативна для бактерий.

S Loechel, J M Inamine, P C Hu. A novel translation initiation region from Mycoplasma genitalium that functions in Escherichia coli. // Nucleic Acids Research. — 1991-12-25. — Т. 19, вып. 24. — С. 6905–6911. — ISSN 0305-1048.

Кроме того, у микоплазмы последовательность Шайна-Дальгарно отсутствует у генов 16S РНК [8].

Источники:

1. Xiongwen Cao, Sarah A. Slavoff. Non-AUG start codons: Expanding and regulating the small and alternative ORFeome (англ.) // Experimental Cell Research. — 2020-06. — Vol. 391, iss. 1. — P. 111973. — doi:10.1016/j.yexcr.2020.111973.

2. Michael Widjaja, Iain James Berry, Veronica Maria Jarocki, Matthew Paul Padula, Roger Dumke, Steven Philip Djordjevic. Cell surface processing of the P1 adhesin of Mycoplasma pneumoniae identifies novel domains that bind host molecules (англ.) // Scientific Reports. — 2020-04-14. — Vol. 10, iss. 1. — P. 6384. — ISSN 2045-2322. — doi:10.1038/s41598-020-63136-y.

3. F Zinoni, J Heider, A Böck. Features of the formate dehydrogenase mRNA necessary for decoding of the UGA codon as selenocysteine. (англ.) // Proceedings of the National Academy of Sciences. — 1990-06. — Vol. 87, iss. 12. — P. 4660–4664. — ISSN 1091-6490 0027-8424, 1091-6490. — doi:10.1073/pnas.87.12.4660.

4.Jett Liu, Alexander L. Jaffe, LinXing Chen, Batbileg Bor, Jillian F. Banfield. Host translation machinery is not a barrier to phages that infect both CPR and non-CPR bacteria (англ.). — 2022-11-23. — P. 2022.11.22.517103. — doi:10.1101/2022.11.22.517103.

5. J M Inamine, K C Ho, S Loechel, P C Hu. Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum (англ.) // Journal of Bacteriology. — 1990-01. — Vol. 172, iss. 1. — P. 504–506. — ISSN 1098-5530 0021-9193, 1098-5530. — doi:10.1128/jb.172.1.504-506.1990.

6. Paul M. Sharp, Michele Stenico, John F. Peden, Andrew T. Lloyd. Codon usage: mutational bias, translational selection, or both? // Biochemical Society Transactions. — 1993-11-01. — Т. 21, вып. 4. — С. 835–841. — ISSN 1470-8752 0300-5127, 1470-8752. — doi:10.1042/bst0210835.

7. Kazuharu Arakawa, Masaru Tomita. The GC Skew Index: A Measure of Genomic Compositional Asymmetry and the Degree of Replicational Selection // Evolutionary Bioinformatics Online. — 2007-09-06. — Т. 3. — С. 159–168. — ISSN 1176-9343).

8. Kyungtaek Lim, Yoshikazu Furuta, Ichizo Kobayashi. Large variations in bacterial ribosomal RNA genes // Molecular Biology and Evolution. — 2012-10. — Т. 29, вып. 10. — С. 2937–2948. — ISSN 1537-1719. — doi:10.1093/molbev/mss101.

Users/liza-p/python12 (последним исправлял пользователь liza-p 2022-12-15 20:12:08)