Практикум 12 (13)
Задание 1
Escherichia coli:
ATG – 3883
GTG – 334
TTG – 78
ATT – 4
CTG – 2
TTC – 1
Candidatus Gracilibacteria bacterium:
ATG – 1129
GTG – 41
TTG – 23
TCA – 1
TCT – 1
ACA – 1
Mycoplasma pneumoniae:
ATG – 634
GTG – 62
TTG - 40
ATT – 4
CTG – 4
ATC – 3
ATA – 2
ACC – 2
TTA – 2
GTT – 1
Все бактерии используют ATG в качестве старт-кодона, однако иногда его могут заменять другие кодоны. У вида Mycoplasma pneumoniae в 120 последовательностях наблюдаются иные старт-кодоны; чаще всего это GTG и TTG, гораздо реже встречаются остальные кодоны. У Candidatus Gracilibacteria bacterium число таких «отклонений» составляет 67; среди них также преобладают GTG и TTG, по одному разу встречаются TCA, ACA и TCT. Escherichia coli имеет отклонения в 419 последовательностях; помимо GTG и TTG среди них присутствуют ATT, TTC, CTG.
Наблюдаемое явление можно объяснить необходимостью в регуляции транскрипции гена (мРНК будет считываться реже, чем с типичным кодоном ATG), либо же способностью тРНК связываться с некоторыми альтернативными старт-кодонами ввиду их частичной комплементарности (в первую очередь с GTG и TTG).
Задание 2
Стоп-кодон TGA в срединном положении встречается в последовательностях 249, AAD13438.1_1457, AAD13456.1_3815, AAD13462.1_3987. В нетипичных случаях этот стоп-кодон кодирует аминокислоту селеноцистеин; на этот факт указывает графа (transl_except=(pos:..,aa:Sec)) в описаниях последних трёх последовательностей. Первая последовательность представляет собой псевдоген; вероятно, он утратил свою функцию в результате мутации, приведшей к образованию стоп-кодона.
>lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
>lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
>lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
>lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Задание 3
Для E. coli частоты стоп-кодонов составляют:
TGA 1241
TAA 2756
TAG 303
Candidatus G. bacterium:
TGA 1
TAA 1000
TAG 188
M. pneumoniae:
TGA 0
TAA 531
TAG 210
Видно, что для второй и третьей бактерий характерно отсутствие стоп-кодона TGA в терминальном положении в последовательностях. Между тем, у Candidatus G. bacterium этот кодон 1089 раз встречается в последовательностях в срединном положении, а у M. pneumoniae – 532 раза. При сравнении нуклеотидных и аминокислотных последовательностей в них обнаруживаются расхождения. У бактерии Candidatus G. bacterium позиции, соответствующие кодону TGA, занимает аминокислота глицин, а у M. pneumoniae – триптофан. Эта переориентация стоп-кодона подтверждается в следующих исследованиях и объясняется наличием специальной тРНК с антикодоном UCA:
Inamine, J. M., K. C. Ho, S. Loechel, and P. C. Hu, 1990, Evidence that UGA is read as a tryptophan codon rather than as a stop codon by Mycoplasma pneumoniae, Mycoplasma genitalium, and Mycoplasma gallisepticum, J. Bacteriol.
Sieber, C., Paul, B. G., Castelle, C. J., Hu, P., Tringe, S. G., Valentine, D. L., Andersen, G. L., & Banfield, J. F., 2019, Unusual metabolism and hypervariation in the genome of a Gracilibacterium (BD1-5) from an oil-degrading community, mBio.
Задание 4
Escherichia coli:
TTA –18484
TTG – 18283
CTT – 14719
CTC – 14926
CTA – 5201
CTG – 71198
Candidatus Gracilibacteria bacterium:
TTA – 14767
TTG – 3237
CTT – 9333
CTC – 3968
CTA – 3357
CTG – 1714
Mycoplasma pneumoniae:
TTA – 10302
TTG – 5601
CTT – 2798
CTC – 3161
CTA – 2848
CTG – 2473
1. Разная частота используемости синонимичных кодонов обусловлена феноменом «предпочтения кодонов». На организменном уровне его можно объяснить несколькими факторами. Среди них – случайное распределение мутаций; корреляция с GC-составом на разных участках генома; зависимость частоты кодонов от встречаемости соответствующих тРНК.
2. На межвидовом уровне разница в используемости тех или иных кодонов, скорее всего, объясняется различным GC-составом, а также наличием различных комбинаций генов, имеющих разные кодонные предпочтения. Также не исключено, что совпадения в частотах встречаемости обусловлены одинаковыми или схожими генами/оперонами, а также присутствием общих профаговых элементов в геноме.
Задание 5
Минимум – 3 870 000, максимум – 1 513 000. Минимальное значение соответствует точке начала репликации (OriC), максимальное – точке завершения (терминации) репликации (ter).
По ссылке ниже – таблица зависимости локального и общего (кумулятивного) GC skew от позиции в геноме:
https://docs.google.com/spreadsheets/d/1VhfGTAuaaxEQGtzFJpEQGOGhHbp4yvxQV9C_rT_c0Dw/edit?usp=sharing
Задание 6
У Escherichia coli чаще всего встречаются такие 6-меры, как AAGGAG, AAGGAG, ATGAAA, GAAAAA, TGAAAA, AGGAGG, GGAGGA, GGAGGT, GAGGAG.
Эти последовательности нуклеотидов являются т.н. последовательностями Шайна-Дальгарно, которые обеспечивают связывание рибосомы с мРНК и дальнейшее протекание трансляции.