Отчет по практикуму 13
Задание 1. Старт кодоны
Escherichia coli
ATG 3890
ATT 4 (usual protein)
CTG 2 (usual protein)
GTG 338
TTC 1 (pseudogene LomR)
TTG 80
Candidatus Gracilibacteria bacterium
ACA 1 (pseudogene of hypothetical protein)
ATG 1129
GTG 41
TCA 1
TCT 1 (pseudogene)
TTG 23
Mycoplasma pneumoniae
AAA 1
ACA 1
ACT 1
ATA 3
ATC 1
ATG 627
ATT 7 (usual protein)
CAA 1
CAC 1
CTA 1
CTC 3
CTG 2
GAA 1
GTG 60
GTT 1
TCC 2
TCT 1
TGA 1
TTA 1
TTC 1
TTG 49
Можно заметить, что самым часто встречающимся старт-кодоном у анализируемых бактерий является всё-таки ATG (метионин). Довольно часто в начале последовательностей встречаются и кодоны GTG, TTG, отличающиеся от вышеуказанного кодона ATG одним нуклеотидом. Это явление объясняется единичными, точечными мутациями, которые не сильно влияют на выживаемость организма и сохраняются в ходе естественного отбора.
Стоит упомянуть, что использование отличных от ATG кодонов всё-таки свойственно бактериям и археям. [6]
Задание 2. Стоп кодоны не в конце последовательностей
Escherichia coli
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
В четырех последовательностях стоп-кодоны содержатся не только в конце. Первая - псевдоген. Эта последовательность - ген, утративший способность кодировать белок и не экспрессирующийся в клетке. Вероятно, произошли мутации и/или рамка считывания (ORF) была смещена, в результате чего кодон, ранее кодировавший аминокислоту, стал стоп-кодоном. Вторая, третья и четвертая последовательности кодируют субъединицы формиатдигидрогеназы (Fdh). Исследование 2003 года [2] показало, что Escherichia coli синтезирует три фермента формиатдегидрогеназы: Fdh-N, Fdh-H и Fdh-O. Синтез связанного с мембраной фермента Fdh-N максимален в условиях анаэробного роста клеток, когда присутствует нитрат; формиатдегидрогеназа H (Fdh-H) - селенополипептид, входит в состав комплекса формиат-водород-лиаза и либо находится в цитоплазме клетки, либо свободно связан с внутренней поверхностью цитоплазматической мембраны; третья формиатдегидрогеназа, формиатдегидрогеназа O (Fdh-O), связана с мембраной и структурно и иммунологически родственна Fdh-N [2].
У селеноцистеина нет своего кодона, и кодон TGA (с некоторой последовательностью после него), встречающийся в геноме, кодирует именно эту редко встречающуюся аминокислоту.
Задание 3. Частота встречаемости стоп кодонов
Escherichia coli
TGA 1251
TAA 2763
TAG 306
Candidatus Gracilibacteria bacterium
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae
TGA 0
TAA 526
TAG 220
"Пропавшим" стоп-кодоном у Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae является кодон TGA. Вероятно, в геноме этот триплет выполняет другую функцию, например, кодирует какую-то аминокислоту. Это можно подтвердить подсчетом общего количества кодонов: TGA довольно часто встречается в геноме и у первой, и у второй бактерии. Исследование 2014 года [3] свидетельствует о том же: предсказание о том, что TGA кодирует глицин в Gracilibacteria, было экспериментально подтверждено[4].
Известно, что TGA у Candidatus Gracilibacteria кодирует глицин [4], а у Mycoplasma pneumoniae - триптофан [7].
Задание 4. Лейцин
Escherichia coli
TTA 18505
TTG 18301
CTA 5203
CTC 14952
CTG 71305
CTT 14728
Candidatus Gracilibacteria bacterium
TTA 15077
TTG 8048
CTA 4861
CTC 4491
CTG 4147
CTT 8053
Mycoplasma pneumoniae
TTA 9246
TTG 6554
CTA 3505
CTC 2193
CTG 3054
CTT 4623
В большинстве случаев частота использования кодона связана с количеством соответствующей тРНК. Видно, что Escherichia coli "предпочитает" кодон, богатый C и G - СTG; две другие бактерии, напротив, отдают предпочтение кодонам с низким содержанием гуанина и цитозина, в их геномах преобладает TTA. GC-состав, таким образом, напрямую влияет на частоты встречаемости кодонов, являясь ключевым аспектом при обсуждении устойчивости белков к изменению (главным образом - повышению) температуры.
С другой стороны, причиной корреляции может являться естественный отбор.
Различия в частотах встречаемости кодонов внутри одного генома может объясняться химическими свойствами нуклеотидов, между разными видами бактерий - различиями в генетическом коде, образе жизни. Но не стоит забывать и о мутациях.
Задание 5. Cumulative GC-skew
Escherichia coli
График зависимости можно найти тут.
max - 1513000 bp - ter (терминация репликации)
min - 3870000 - oriC (инициация репликации)
Задание 6. 6-меры
Escherichia coli
AAGGAG 329
TAAGGA 282
AGGAGA 254
CAGGAG 255
AAGGAA 222
AGGAGT 215
Вышеуказанные 6-меры, вероятно, являются последовательностями Шайна-Дальгарно, влияющими на уровень экспрессии генов. Обычно они располагаются на расстоянии 10 нуклеотидов (это число может варьироваться) от старт-кодона. Такое обоснование согласуется с полученными результатами, есть учесть, в каком диапазоне производился поиск этих 6-меров.
Источники
[1] Xiongwen Cao, Sarah A. Slavoff. Non-AUG start codons: Expanding and regulating the small and alternative ORFeome // Experimental Cell Research. — 2020-06. — Vol. 391, iss. 1. — P. 111973. — doi:10.1016/j.yexcr.2020.111973.
[2] Wang H, Gunsalus RP. Coordinate regulation of the Escherichia coli formate dehydrogenase fdnGHI and fdhF genes in response to nitrate, nitrite, and formate: roles for NarL and NarP. J Bacteriol. 2003 Sep;185(17):5076-85. doi: 10.1128/JB.185.17.5076-5085.2003. PMID: 12923080; PMCID: PMC180993.
[3] Hanke A, Hamann E, Sharma R, Geelhoed JS, Hargesheimer T, Kraft B, Meyer V, Lenk S, Osmers H, Wu R, Makinwa K, Hettich RL, Banfield JF, Tegetmeyer HE, Strous M. 2014. Recoding of the stop codon UGA to glycine by a BD1-5/SN-2 bacterium and niche partitioning between Alpha- and Gammaproteobacteria in a tidal sediment microbial community naturally selected in a laboratory chemostat. Front Microbiol 5:231. doi: 10.3389/fmicb.2014.00231. [PMC free article] [PubMed] [CrossRef] [Google Scholar] [Ref list]
[4] Sieber CMK, Paul BG, Castelle CJ, Hu P, Tringe SG, Valentine DL, Andersen GL, Banfield JF. Unusual Metabolism and Hypervariation in the Genome of a Gracilibacterium (BD1-5) from an Oil-Degrading Community. mBio. 2019 Nov 12;10(6):e02128-19. doi: 10.1128/mBio.02128-19. PMID: 31719174; PMCID: PMC6851277.
[5] Riber L, Løbner-Olesen A. Coordinated replication and sequestration of oriC and dnaA are required for maintaining controlled once-per-cell-cycle initiation in Escherichia coli. J Bacteriol. 2005 Aug;187(16):5605-13. doi: 10.1128/JB.187.16.5605-5613.2005. PMID: 16077105; PMCID: PMC1196069.
[6] The Genetic Codes. Compiled by Andrzej (Anjay) Elzanowski and Jim Ostell at National Center for Biotechnology Information (NCBI), Bethesda, Maryland, U.S.A.; раздел 11.
[7] Inamine JM, Ho KC, Loechel S, Hu PC. Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum. J Bacteriol. 1990 Jan;172(1):504-6. doi: 10.1128/jb.172.1.504-506.1990. PMID: 2104612; PMCID: PMC208464.
Сопроводительные материалы
Скрипты можно найти тут.