Практикум №13
Задания практикума 13
Задание 1.
Escherichia coli str. K-12 substr. MG1655
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae M29
AAA 1
ACA 1
ACT 1
ATA 3
ATC 1
ATG 627
ATT 7
CAA 1
CAC 1
CTA 1
CTC 3
CTG 2
GAA 1
GTG 60
GTT 1
TCC 2
TCT 1
TGA 1
TTA 1
TTC 1
TTG 49
Как можно увидеть из полученных результатов, помимо наиболее распространенного и стандартного кодона ATG(который кодирует метионин) встречаются также и другие варианты. Многие кодоны встречаются всего несколько раз и нередко именно с них начинаются псевдогены(за счет изменения первого кодона в результате каких-либо мутаций). К счастью, подобные мутации, как правило, протекают незаметно, без каких-либо последствий для организма. Примечательно, что довольно часто встречаются такие кодоны, как GTG и TTG, их значительно меньше чем того же ATG, но все же достаточно. И вот здесь начинается самое интересное
Известно, что у бактерий, растений и архей с этих кодонов могут начинаться некоторые кодирующие белок-последовательности. Собственно говоря, поэтому их генетический код и рассматривается отдельно от стандартного.
Также имеются работы, которые показывают, что эти кодоны могут быть использованы в жизненно-важных генах(связаны с транскрипцией, репликацией и трансляцией). Следовательно, это может служить в качестве дополнительной регуляции экспрессии, что может быть крайне выгодно при голодании.
https://www.researchgate.net/publication/343877260_Genes_Preferring_Non-AUG_Start_Codons_in_Bacteria
Задание 2.
Escherichia coli str. K-12 substr. MG1655
Заданные по условию стоп-кодоны встретились в данных 4 последовательностях:
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Понятно? Пока не очень. Значит, надо разобраться.
В первом случае имеем "разорванный" псевдоген. Такая последовательность не кодирует белок
Оставшиеся три последовательности кодируют формиатдегидрогеназу. К тому же, в них TGA кодирует не только стоп-кодон, но и селеноцистеин(21-я протеиногенная аминокислота, C₃H₇NO₂Se, которая не имеет собственного кодона). А еще селеноцистеин важен для катализа. Немного про эту чудную аминокислоту.
Задание 3.
Escherichia coli str. K-12 substr. MG1655
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 526
TAG 220
У Mycoplasma pneumoniae M29 и Candidatus Gracilibacteria bacterium 28_42_T64 TGA как раз таки является тем самым кодоном-потеряшкой. В данном случае TGA вообще не является стоп-кодоном, он кодирует аминокислоты триптофан (у Mycoplasma pneumoniae M29, https://pubmed.ncbi.nlm.nih.gov/7691196/) и глицин (у Candidatus Gracilibacteria bacterium 28_42_T64, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3619370/). И только в одном псевдогене у Candidatus Gracilibacteria bacterium 28_42_T64 он замыкает кодирующую белок-последовательность. Из всего напечатанного, можно сделать вывод, что "потерянными" кодоны могут стать просто из-за замены их функций. В нашем случае, это кодирование определенных аминокислот.
Задание 4.
Escherichia coli str. K-12 substr. MG1655
CTA 5203
CTC 14952
CTG 71305
CTT 14728
TTA 18505
TTG 18301
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 4861
CTC 4491
CTG 4147
CTT 8053
TTA 15077
TTG 8048
Mycoplasma pneumoniae M29
CTA 3505
CTC 2193
CTG 3054
CTT 4623
TTA 9246
TTG 6554
Из результатов видно, что частота использования кодонов, которые кодируют лейцин, различается и между бактериями, и в пределах одной бактерии. Какие причины? Скорее всего, это связано с количеством тРНК и экспрессией генов, а также GC-составом. Т.е. между разными бактериями подобное объясняется различиями в генетическом коде, а внутри одной - химическими свойствами нуклеотидов.
Задание 5.
Escherichia coli str. K-12 substr. MG1655
Ссылка на график: График в гугл-таблицах
Минимальное значение соответствует ориджину репликации, а максимальное значение - концу репликации.
Задание 6.
Escherichia coli str. K-12 substr. MG1655
(Ниже представлены 10 самых "популярных")
AAGGAG 327
TAAGGA 282
CAGGAG 254
AGGAGA 253
AAAGGA 222
AAGGAA 221
AGGAGT 212
GGAGAA 204
AGGAAA 187
ACAGGA 177
Несложно заметить, что почти во всех представленных результатах имеется интересная комбинация "AGGA". При этом, если мы будем рассматривать лишь те последовательности, в которых данная комбинация содержится, то мы найдем 1663 таких гексамера. Достаточно внушительное число. Это указывает на то, что перед кодирующими последовательностями содержатся последовательности Шайна-Дальгарно, которые нужны для связывания мРНК с 16S РНК при инициации трансляции. https://pubmed.ncbi.nlm.nih.gov/32065583/