Задание 1
Встречаемость старт-кодонов у E. coli: ATG 3890 |#| GTG 338 |#| TTG 80 |#| ATT 4 |#| CTG 2 |#| TTC 1 (псевдоген)
У C. Gracilibacteria: ATG 1129 |#| GTG 41 |#| TTG 23 |#| ACA 1 (псевдоген) |#| TCA 1 (псевдоген) |#| TCT 1 (псевдоген)
У M. pneumoniae: ATG 627 |#| GTG 60 |#| TTG 49 |#| ATT 7 (1 псевдоген) |#| ATA 3 (псевдогены) |#| CTC 3 (псевдогены) |#| CTG 2 |#| TCC 2 (1 псевдоген) |#| AAA 1 (псевдоген) |#| ACA 1 (псевдоген) |#| ACT 1 (псевдоген) |#| ATC 1 |#| CAA 1 (псевдоген) |#| CAC 1 (псевдоген) |#| CTA 1 (псевдоген) |#| GAA 1 (псевдоген) |#| GTT 1 (псевдоген) |#| TCT 1 (псевдоген) |#| TGA 1 (псевдоген) |#| TTA 1 |#| TTC 1 (псевдоген)
Как можно заметить, у бактерий встречаются не только ATG старт-кодоны. Часто встречающиеся кодоны отличаются от ATG только одной буквой. По всей видимости, у бактерий изменен генетический код так, что старт-кодонов несколько (на самом деле так и есть [1]). Для редких старт-кодонов причина возникновения не понятна, за исключением псевдогенов.
Задание 2
У "E. coli" в 4 четырех генах стоп-кодон встречается не только в конце. В первых 3 генах стоп-кодон UGA кодирует селеноцистеин [2]. Терминации не происходит за счет образования шпильки РНК [3]. Четвертая последовательность просто является псевдогеном. Список:
1. Альфа субъединица дегидрогеназы N (стоп в позиции 586-588 означает аминокислоту)
2. Альфа субъединица дегидрогеназы O (586-588)
3. Дегидрогеназа H (418-420)
4. Регуляторный фрагмент IS911A (псевдоген)
Задание 3
Таблица встречаемости стоп-кодонов в геноме бактерий:
|
E. coli |
C. Gracilibacteria bacterium |
M. pneumoniae |
|||
TGA |
1246 |
1 |
0 |
|||
TAA |
2761 |
1000 |
526 |
|||
TAG |
306 |
188 |
220 |
Также крайне редких встречаются несколько других кодонов в конце последовательностей. У двух последних бактерий кодон TGA фактически потерял свою функцию. На самом деле этот кодон кодирует аминокислоту. Такой генетический код более выгоден с эволюционной точки точки зрения, так как он дает большую устойчивость к мутациям (у триптофана на 3 месте кодона стоит пиридиновое основание, что уменьшает вероятность миссенс-мутации). Такой генетический код описан в литературе [1](У Candidatus Gracilibacteria этот стоп кодон кодирует не Trp, а Gly).
Задание 4
Таблица встречаемсти кодонов, кодирующих лейцин:
|
E. coli |
C. Gracilibacteria bacterium |
M. pneumoniae |
|||
CTA |
5203 |
3357 |
2826 |
|||
CTC |
14952 |
3968 |
3158 |
|||
CTG |
71305 |
1714 |
2470 |
|||
CTT |
14728 |
9332 |
2782 |
|||
TTA |
18505 |
14766 |
10294 |
|||
TTG |
18301 |
3237 |
5571 |
Разная встречаемость кодонов одной аминокислоты является эволюционным приобретением. Количество транспортной РНК на данный кодон пропорционально количеству кодона в генах. Таким образом гены, содержащие часто встречающиеся кодоны в большом количестве транслируются быстрее (upper box), а гены с редкими кодонами медленней (lower bow) [4]. У разных бактерий отличный кодон-лидер, так как они эволюционируют независимо.
Задание 5
Геном бактерии имеет максимум кумулятивного GC-skew 1513000, а минимум - 3870000. Минимум соответствует ориджину, а максимум сайту терминации репликации (описано в заданиях к мини обзору). В действительности ориджин расположен на участке 3925744-3925975. График построен в гугл таблицах [5].
Задание 6
Среди 6-меров встречаются в подавляющем большинстве AG богатые, а самая встречающаяся - AAGGAG. Это объясняется тем, что в в промежутке от -20 до 0 находится регуляторная последовательность для связывания рибосомы (Шайно-Дальгарно). В таблице [5] на листе 6-mers находится таблица и диаграмма количеств каждого 6-мера.
Ссылки
1) Seligmann H. Phylogeny of genetic codes and punctuation codes within genetic codes //Biosystems. – 2015. – Т. 129. – С. 36-43.
2) Berg B. L. et al. Nitrate-inducible formate dehydrogenase in Escherichia coli K-12. I. Nucleotide sequence of the fdnGHI operon and evidence that opal (UGA) encodes selenocysteine //Journal of Biological Chemistry. – 1991. – Т. 266. – №. 33. – С. 22380-22385.
3) Heider J., Böck A. Targeted insertion of selenocysteine into the alpha subunit of formate dehydrogenase from Methanobacterium formicicum //Journal of bacteriology. – 1992. – Т. 174. – №. 3. – С. 659-663.
4) Zheng B. et al. Utilization of rare codon-rich markers for screening amino acid overproducers //Nature communications. – 2018. – Т. 9. – №. 1. – С. 1-11.
5) Таблица с некоторыми решениями. На листе GC-skew график соответствующей величины, на листе 6-mers список количества всех 6-меров и график их встречаемости. table