Kodomo

Пользователь

Практикум 12

Изучение распространённости нестандартных старт-кодонов

У Mycoplasma pneumoniae M29 были обнаружены 21 разных видов старт-кодонов, встречающихся 139 раз(AAA:1, ACA:1, ACT:1, ATA:3, ATC:1, ATG:627, ATT:7, CAA:1, CAC:1, CTA:1, CTC:3, CTG:2, GAA:1, GTG:60, GTT:1, TCC:2, TCT:1, TGA:1, TTA:1, TTC:1, TTG:49), причём их встречаемость различна: 60 и 49 раз встретились только GUG и TUG, соответственно; остальные не более 10 раз. С 17 из 21 кодона начинаются псевдогены или гены гипотетических белков. Синтез белка происходит только с генов со старт кодонами GTG, TTG, ATT и TTA, все они имеют некоторое сходство с ATG: у TTG на первой позиции вместо аденина урацил, однако остальные 2 совпадают; у GTG на первой позиции гуанин, который также как и аденин является пурином(а, следовательно, имеет похожий размер), остальные те же; у ATT два первые нуклеотида совпадают с таковыми у ATG; у TTA с ATG не совпадают первый и последний нуклеотиды, но третьи - оба пурины.

У Escherichia coli str. K-12 6 нестандартных старт-кодонов, встречающихся 425 раз(ATT:4, CTG:2, GTG:338, TTC:1, TTG:80), только в псевдогенах или в генах гипотетических белков среди них является "старт-кодоном" TTC, а остальные имеют различия с ATG не более чем на 1 нуклеотид другой природы(пурин, пиримидин).

У Candidatus Gracilibacteria bacterium 28_42_T64 также 6 нестандартных старт-кодонов, которые встречаются 67 раз(ACA:1, GTG:41, TCA:1, TCT:1, TTG:23), ACA, TCA и TCT только в псевдогенах или в генах гипотетических белков, остальные разбирались выше. Возможно, при достаточной схожести последовательности кодона, инициаторная тРНК всё же связывается, хоть и хуже, с кодоном и запускает трансляцию. Наличие у псевдогенов нестандартных старт-кодонов может быть обусловлено тем, что псевдогены не транслируются и нет отбора на возможность синтеза белка с их последовательности.

Встречаемость стоп-кодонов не в качестве последнего кодона у Escherichia coli str. K-12

У 4х генов в последовательности встречается стоп-кодон не в последнем положении. Один из них является псевдогеном, в которых могут возникать стоп кодоны, тк они и так не транслируются. Три других - гены формиатдегидрогеназы, в которых вместо терминации TGA вызывает встраивание селеноцистеина. Это обусловлено наличием особой вторичной структуры.

Частоты стоп-кодонов

Частота кодонов у Escherichia coli str. K-12 TGA:1246, TAA:2761, TAG:306, ATA:1, GAA:1.

Частота кодонов у Mycoplasma pneumoniae M29 TGA:0, TAA:526, TAG:220, ACT:1, ATA:1, CTA:1, GGG:5, GGC:1, AAT:1, CCC:1, CGG:1, GGT:3, GAT:1, TAT:1, TAC:1, AAA:1, TTA:1.

Частота кодонов у Candidatus Gracilibacteria bacterium 28_42_T64 TGA:1, TAA:1000, TAG:188, TCT:2, TTA:1, AAA:1, CTT:1, ACA:1, GAA:1.

У M.pneumoniae и C.gracilibacteria TGA не является стоп-кодоном: у первой он кодирует триптофан, у второй - глицин. Это связано с мутацией в соответствующих тРНК и в факторах терминации. [1]

Частота кодонов, кодирующих лейцин

Escherichia coli TTA: 18505, TTG: 18301, CTT: 14728, CTC: 14952, CTA: 5203, CTG: 71305

Candidatus Gracilibacteria TTA: 14767, TTG: 3237, CTT: 9333, CTC: 3968, CTA: 3357, CTG: 1714

Mycoplasma pneumoniae TTA: 10295, TTG: 5571, CTT: 2782, CTC: 3158, CTA: 2826, CTG: 2470

Различная встречаемость синонимичных кодонов в разных генах одного и того же организма обусловлена регуляцией:гены, содержащие неоптимальные кодоны, для которых синтезируется мало тРНК, либо с которыми они плохо связываются, хуже экспрессируются чем гены, состоящие из оптимальных кодонов. В разных организмах разное отношение синонимических кодонов может быть обусловлено температурным режимом обитания(оптимизация GC-состава)

GC-scew

Минимум cumulative GC-skew находится в позиции 3870000 и соответствует точке начала репликации (ориджину), максимум - в позиции 1513000 и соответствует точке окончания репликации (термиус). Такая картина обусловлена тем, что на лидирующей цепи происходит спонтанное дезаминирование цитозина, которое репарируется на ней хуже чем на отстающей. [2,3]

Поиск 6-меров

Для изучения встречаемости 6-меров я выбрал бактерию Acidithiobacillus ferrooxidans, про которую мой обзор. Поиск 6-меров в 20-нуклеотидном участке перед стартовым кодоном во всех кодирующих последовательностях дал следующие результаты: AAGGAG: 171, AGGAGA: 127, CAGGAG: 108, AGGAGG: 100, AGGAGT: 99, GGAGAA: 98, AAAGGA: 95, GAGGAG: 90, CAAGGA: 79, AGGAGC: 78, GGAGGA: 77, AAAAGG: 68, TGAGGA: 67, GGAGCA: 63, GGAGAT: 60, GGAGGT: 60, GAGGTG: 60, CGGAGG: 59, GAAGGA: 58, TAAGGA: 58, GAGGAT: 55, GGAGGG: 55, GGAAAA: 53, AAGGAA: 52, GAGAAA: 51, GAAAAA: 51, ACAGGA: 51, GGAGTG: 51, CCGGAG: 51, GAGGAA: 50, GGAGTT: 50. Остальные последовательности, имеющие меньшую встречаемость, не приведены. Многие из этих последовательностей могут быть вариациями последовательности Шайна-дальгарно (AGGAGG), находящейся на 10 нуклеотидов выше старт-кодона и обеспечивающей посадку рибосомы на мРНК.[4]

Литература

1. Ivanova, N. N.; Schwientek, P.; Tripp, H. J.; Rinke, C.; Pati, A.; Huntemann, M.; Visel, A.; Woyke, T.; Kyrpides, N. C.; Rubin, E. M. (2014). Stop codon reassignments in the wild. Science, 344(6186), 909–913. doi:10.1126/science.1250691

2.Analyzing genomes with cumulative skew diagrams Andrei Grigoriev https://doi.org/10.1093/nar/26.10.2286

3. The GC Skew Index: A Measure of Genomic Compositional Asymmetry and the Degree of Replicational Selection Kazuharu Arakawa and Masaru Tomita https://doi.org/10.1177/11769343070030000

4. Noller H. F. Structure of the bacterial ribosome and some implications for translational regulation // Translational Control in Biology and Medicine / Edited by N. Sonenberg, J. W. B. Hershey and M. B. Mathews. Cold Spring Harbor, NY: Cold Spring Harbor Press, 2007. P. 41-58

Ссылка на папку со скриптами и графиком в гугл-диске

https://drive.google.com/drive/folders/1LJmiwvzOSTzH15nRylnA4qze8lSzfONW?usp=sharing

Users/timurk/pr12 (последним исправлял пользователь timurk 2022-12-22 19:45:36)