Практикум 13
Ссылка на блокнот Colab с кодами
Задание 1
Наиболее часто у этих бактерий встречаются альтернативные старт-кодоны GTG и TTG. Наибольшее разнообразие старт-кодонов наблюдается у Mycoplasma pneumoniae.
Возможно, при помощи различных старт-кодонов можно регулировать экспрессию соответствующих генов. Кроме того, во многих случаях такие гены с редкими старт-кодонами - псевдогены, значит не было отбора в сторону сохранения изначального стоп-кодона и он мог измениться в результате случайных мутаций.
Задание 2
Первый ген является псевдогеном, и, вероятно, стоп-кодон в рамке считывания в нём появился из-за случайной мутации. В случае остальных трёх - стоп-кодон TGA кодирует селеноцистеин, а не терминирует трансляцию благодаря SECIS - selenocystein insertion sequence.
Задание 3
У последних двух бактерий практически не встречается стоп-кодон TGA: в Gracilibacteria он кодирует глицин[1], а в Mycoplasma pneumoniae и некоторых других видах этого рода - триптофан[2].
Напротив, в рамке считывания TGA у этих двух бактерий встречается намного чаще, чем у E. coli. В рамке считывания Mycoplasma pneumoniae встречается сравнительно много кодонов TAA и TAG, но их всё равно сильно меньше, чем TGA. Возможно у этой бактерии в целом большое количество псевдогенов, поэтому так много стоп-кодонов в рамке считывания.
Задание 4
В кодирующих последовательностях E. coli для кодирования лейцина наиболее часто используется кодон CTG, а реже всего - CTA, Gracilibacteria и Mycoplasma - наиболее частый TTA, наименее - CTG.
Количество различных синонимичных тРНК в клетке не одинаково, и скорость трансляции зависит от используемого кодона. Кроме того мутации из одного нуклеотида в другой происходят не с равной вероятностью, поэтому одни сайленс-мутации происходят чаще других.
Задание 5
Знак GC skew различается на лидирующей и отстающей цепях: отстающая цепь более подвержена мутациям, и, наверное, наиболее частой мутацией является дезаминирование цитозина. При этом разность G - С на отстающей цепи растёт, а на лидирующей наоборот снижается(?). Смена знака как раз происходит в точках начала и конца репликации, поэтому в них находятся минимум и максимум cumulative GC skew. Почему минимум находится в начале, а максимум в конце - честно говоря, не совсем понимаю.
Задание 6
Наиболее часто встречаются гексамеры с низким GC-составом, вероятно потому, что этот участок ДНК нужно плавить для начала транскрипции.
[1] Hervé Seligmann Phylogeny of genetic codes and punctuation codes within genetic codes https://doi.org/10.1016/j.biosystems.2015.01.003
[2] Inamine et al. 1990 Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum https://doi.org/10.1128/jb.172.1.504-506.1990