Практикум 13
Задание 1
Escherichia coli str. K-12 substr. MG1655
ATG 3883
ATT 4
CTG 2
GTG 334
TTC 1
TTG 78
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae M29
ACC 2
ATA 2
ATC 3
ATG 634
ATT 4
CTG 4
GTG 62
GTT 1
TTA 2
TTG 40
В основном в качестве старт-кодона используется кодон ATG. Гораздо реже используются похожие кодоны GTG и TTG. Кодон CTG, а также ряд других кодонов, используются крайне редко.
Возможные причины наличия нескольких старт-кодонов:
- Возможно, за счет разного сродства инициаторной тРНК к разным кодонам осуществляется регуляция интенсивности трансляции мРНК.
- Наличие необычных старт-кодонов может играть роль в защите от фаговых инфекций.
- Возможно, из-за особенностей структуры антикодонной петли инициаторной тРНК замена первого нуклеотида старт-кодона на G или T слабо влияет на интенсивность трансляции.
Задание 2
Названия и описания последовательностей:
lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Первая последовательность является псевдогеном, который когда-то был геном профага, стоп-кодоны в ней могли возникнуть в результате ряда случайных мутаций. Остальные последовательности кодируют субъединицы формиатдегидрогеназы. Этот фермент содержит аминокислоту селеноцистеин, которая кодируется кодоном TGA за счет образования особой шпильки во вторичной структуре мРНК.
Задание 3
Частоты стоп-кодонов в конце кодирующих последовательностей:
Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 531
TAG 210
На всей длине кодирующих последовательностей:
Escherichia coli str. K-12 substr. MG1655
TGA 1246
TAA 2758
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 15446
TAA 1001
TAG 192
Mycoplasma pneumoniae M29
TGA 1656
TAA 802
TAG 320
У Gracilibacteria bacterium и Mycoplasma pneumoniae кодон TGA не является стоп-кодоном, и кодирует соответственно глицин и триптофан.
Ссылка на статью:
Kannan TR, Baseman JB. Expression of UGA-containing Mycoplasma genes in Bacillus subtilis. J Bacteriol. 2000;182(9):2664-2667. doi:10.1128/JB.182.9.2664-2667.2000
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTA 5201
CTC 14926
CTG 71198
CTT 14719
TTA 18484
TTG 18283
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 3357
CTC 3968
CTG 1714
CTT 9332
TTA 14766
TTG 3237
Mycoplasma pneumoniae M29
CTA 2848
CTC 3161
CTG 2473
CTT 2798
TTA 10302
TTG 5601
Причины разницы в частоте использования синонимичных кодонов в пределах генома одной бактерии:
- Использование бактерией кодонов, отличных от кодонов в вирусной ДНК (РНК), существенно снижает экспрессию вирусных генов.
- Различия в уровне экспрессии генов разных тРНК могут приводить к изменению частоты использования соответствующих кодонов.
- Соотношение "быстрых" и "медленных" кодонов (по количеству тРНК) является одним из факторов, определяющих интенсивность трансляции.
Причины разницы в частоте использования синонимичных кодонов в геномах разных бактерий (в дополнение к ранее перечисленным):
- Частота использования различных кодонов у каждой бактерии зависит от GC-состава.
Задание 5
Точка минимума на графике cumulative GC-skew соответствует ориджину (точке начала) репликации (oriC), точка максимума - участку, где происходит ее терминация. В целом, это подтверждается информацией из файла в формате genbank (rep_origin 3925744..3925975, тогда как минимум на графике соответствует позиции 3870000)
Задание 6
Самые часто встречающиеся 6-меры (для Escherichia coli):
AGGAGT 110
AAAGGA 119
AAGGAG 178
CAGGAG 122
TAAGGA 156
AGGAGA 128
AAGGAA 122
AGGAAA 100
Это последовательность Шайна — Дальгарно. Она комплементарна участку 16S рРНК и участвует в связывании рибосомы с мРНК при инициации трансляции у прокариот. Консенсусная последовательность: AGGAGG.