Практикум 13
Скрипты и файлы: https://drive.google.com/drive/folders/1Ka1jO0Q-Nh6EhhEiTuu-c4j6V_KTQPB5
Задание 1
Escherichia coli str. K-12 substr. MG1655:
ATG (3890), ATT (4), CTG (2), GTG (338), TTC (1), TTG (80).
Candidatus Gracilibacteria bacterium 28_42_T64:
ACA (1), ATG (1129), GTG (41), TCA (1), TCT (1), TTG (23).
Mycoplasma pneumoniae M29:
AAA (1), ACT (1), ATA (4), ATC (1), ATG (629), ATT (8), CAA (2), CTC (2), CTG (1), GAA (1), GGA (1), GTG (60), GTT (1), TCT (1), TTA (3), TTG (53).
Самыми распространёнными стартовыми кодонами оказались ATG, GTG и TTG. Появление GTG и TTG можно объяснить точечными мутациями триплета ATG. Причинами, по которым GTG и TTG также годятся в качестве стартовых кодонов, могут быть: а) стартовой тРНК глобально не так важна полная комплиментарность; б) белки, участвующие в трансляции у бактерий, изловчились распознавать не только ATG;
Остальные кодоны можно объяснить тем, что они встречаются не в белок-кодирующих последовательностях, а псеводгенах.
Задание 2
Первая последовательность, в которой стоп-кодон находится не в конце, является регуляторной - это аналог триптофанового оперона (thr operon leader peptide, protein_id=AAC73112.1), но с особым способом регуляции - не через шпильки, а через проскок и обход стоп-кодона [1][2][3].
Также четыре стоп-кодона встретились в последовательности, которая является псевдогеном и не кодирует аминокислотную последовательность (из-за чего, вероятно, стоп-кодон и находится не на конце последовательности).
[gene=insN] [locus_tag=b4587] [protein=IS911A regulator fragment] [pseudo=true]
Остальные три последовательности кодируют субъединицы формиатдегидрогеназы (formate dehydrogenase N subunit alpha, formate dehydrogenase O subunit alpha, formate dehydrogenase H). Один из источников подтверждает наличие TGA-кодона в нетипичном для него месте в этих последовательностях и объясняет это тем, что кодон соответсвует селеноцистеину. "The formate dehydrogenases (Fdh) Fdh-O, Fdh-N, and Fdh-H, are the only proteins in Escherichia coli that incorporate selenocysteine at a specific position by decoding a UGA codon"[4].
Задание 3
Escherichia coli str. K-12 substr. MG1655:
- ATA (1), GAA (1), TAA (2761), TAG (306), TGA (1246).
Candidatus Gracilibacteria bacterium 28_42_T64:
- AAA (1), ACA (1), CTT (1), GAA (1), TAA (1000), TAG (188), TCT (2), TGA (1), TTA (1).
Mycoplasma pneumoniae M29:
- AAA (1), AAT (1), ACT (1), ATA (1), ATT (1), CCC (1), GAT (1), GGG (4), GGT (1), TAA (533), TAC (1), TAG (221), TAT (1), TTA (1).
В отличие от Escherichia coli str. K-12 substr. MG1655, у Candidatus Gracilibacteria bacterium 28_42_T64 и Mycoplasma pneumoniae M29 потерян TGA как стоп-кодон. Оказалось, что в случае Mycoplasma pneumoniae M29 кодон TGA кодирует аминокислоту триптофан: "Mycoplasma capricolum was previously found to use UGA instead of UGG as its codon for tryptophan"[5]. Вероятно, для TGA-кодона Candidatus Gracilibacteria bacterium характерно что-то подобное.
Задание 4
Escherichia coli str. K-12 substr. MG1655:
CTT 14728 CTC 14952 CTA 5203 CTG 71305 TTA 18505 TTG 18301
Candidatus Gracilibacteria bacterium 28_42_T64:
CTT 8034 CTC 4491 CTA 4878 CTG 4148 TTA 15107 TTG 8051
Mycoplasma pneumoniae M29:
CTT 5765 CTC 2362 CTA 2674 CTG 2298 TTA 7834 TTG 4488
Избыточность генетического кода позволяет снижать потенциальный эффект мутаций, этим объясняется наличие различных кодонов, кодирующих лейцин у представленных бактерий. Частоты кодонов, кодирующих лейцин ('CTT', 'CTC', 'CTA', 'CTG', 'TTA', 'TTG'), различны как внутри каждой бактерии, так и между бактериями. Различия между бактериями можно объяснить различным GC-составом у разных бактерий, а различия внутри - эволюционно "самыми востребованными" тРНК, которые чаще экспрессируются, с антикодонами к конкретным кодонам.
Задание 5
График: https://drive.google.com/drive/folders/1Ka1jO0Q-Nh6EhhEiTuu-c4j6V_KTQPB5
Cumulative GC-skew = -9.243.
Сопроводительные материалы
[1] - https://elementy.ru/problems/3023/Ot_nachala_do_kontsa
[2] - https://en.wikipedia.org/wiki/Threonine_operon_leader
[3] - https://academic.oup.com/femsle/article/234/2/357/728987?login=false
[4] - Michael Zorn, Christian Ihlin, Ralph Golbik, Gary Sawers. Selective selC-Independent Selenocysteine Incorporation into Formate Dehydrogenases. April 2013PLoS ONE, 8(4):e61913, DOI:10.1371/journal.pone.0061913
[5] - T.H. Jukes. A change in the genetic code in Mycoplasma capricolum. J. Mol. Evol. 1985;22(4):361-2. doi: 10.1007/BF02115692. https://pubmed.ncbi.nlm.nih.gov/3936937/