Kodomo

Пользователь

Практикум №13

Задания практикума 13

Задание 1.

Escherichia coli str. K-12 substr. MG1655

ATG 3890

ATT 4

CTG 2

GTG 338

TTC 1

TTG 80

Candidatus Gracilibacteria bacterium 28_42_T64

ACA 1

ATG 1129

GTG 41

TCA 1

TCT 1

TTG 23

Mycoplasma pneumoniae M29

AAA 1

ACA 1

ACT 1

ATA 3

ATC 1

ATG 627

ATT 7

CAA 1

CAC 1

CTA 1

CTC 3

CTG 2

GAA 1

GTG 60

GTT 1

TCC 2

TCT 1

TGA 1

TTA 1

TTC 1

TTG 49

Как можно увидеть из полученных результатов, помимо наиболее распространенного и стандартного кодона ATG(который кодирует метионин) встречаются также и другие варианты. Многие кодоны встречаются всего несколько раз и нередко именно с них начинаются псевдогены(за счет изменения первого кодона в результате каких-либо мутаций). К счастью, подобные мутации, как правило, протекают незаметно, без каких-либо последствий для организма. Примечательно, что довольно часто встречаются такие кодоны, как GTG и TTG, их значительно меньше чем того же ATG, но все же достаточно. И вот здесь начинается самое интересное :-)

Известно, что у бактерий, растений и архей с этих кодонов могут начинаться некоторые кодирующие белок-последовательности. Собственно говоря, поэтому их генетический код и рассматривается отдельно от стандартного.

Также имеются работы, которые показывают, что эти кодоны могут быть использованы в жизненно-важных генах(связаны с транскрипцией, репликацией и трансляцией). Следовательно, это может служить в качестве дополнительной регуляции экспрессии, что может быть крайне выгодно при голодании.

Задание 2.

Escherichia coli str. K-12 substr. MG1655

Заданные по условию стоп-кодоны встретились в данных 4 последовательностях:

lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Понятно? Пока не очень. Значит, надо разобраться.

В первом случае имеем "разорванный" псевдоген. Такая последовательность не кодирует белок :-(

Оставшиеся три последовательности кодируют формиатдегидрогеназу. К тому же, в них TGA кодирует не только стоп-кодон, но и селеноцистеин(21-я протеиногенная аминокислота, C₃H₇NO₂Se, которая не имеет собственного кодона). А еще селеноцистеин важен для катализа. Немного про эту чудную аминокислоту.

Задание 3.

Escherichia coli str. K-12 substr. MG1655

TGA 1246

TAA 2761

TAG 306

Candidatus Gracilibacteria bacterium 28_42_T64

TGA 1

TAA 1000

TAG 188

Mycoplasma pneumoniae M29

TGA 0

TAA 526

TAG 220

У Mycoplasma pneumoniae M29 и Candidatus Gracilibacteria bacterium 28_42_T64 TGA как раз таки является тем самым кодоном-потеряшкой. В данном случае TGA вообще не является стоп-кодоном, он кодирует аминокислоты триптофан (у Mycoplasma pneumoniae M29, https://pubmed.ncbi.nlm.nih.gov/7691196/) и глицин (у Candidatus Gracilibacteria bacterium 28_42_T64, https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3619370/). И только в одном псевдогене у Candidatus Gracilibacteria bacterium 28_42_T64 он замыкает кодирующую белок-последовательность. Из всего напечатанного, можно сделать вывод, что "потерянными" кодоны могут стать просто из-за замены их функций. В нашем случае, это кодирование определенных аминокислот.

Задание 4.

Escherichia coli str. K-12 substr. MG1655

CTA 5203

CTC 14952

CTG 71305

CTT 14728

TTA 18505

TTG 18301

Candidatus Gracilibacteria bacterium 28_42_T64

CTA 4861

CTC 4491

CTG 4147

CTT 8053

TTA 15077

TTG 8048

Mycoplasma pneumoniae M29

CTA 3505

CTC 2193

CTG 3054

CTT 4623

TTA 9246

TTG 6554

Из результатов видно, что частота использования кодонов, которые кодируют лейцин, различается и между бактериями, и в пределах одной бактерии. Какие причины? Скорее всего, это связано с количеством тРНК и экспрессией генов, а также GC-составом. Т.е. между разными бактериями подобное объясняется различиями в генетическом коде, а внутри одной - химическими свойствами нуклеотидов.

Задание 5.

Escherichia coli str. K-12 substr. MG1655

Ссылка на график: График в гугл-таблицах

Минимальное значение соответствует ориджину репликации, а максимальное значение - концу репликации.

Задание 6.

Escherichia coli str. K-12 substr. MG1655

(Ниже представлены 10 самых "популярных")

AAGGAG 327

TAAGGA 282

CAGGAG 254

AGGAGA 253

AAAGGA 222

AAGGAA 221

AGGAGT 212

GGAGAA 204

AGGAAA 187

ACAGGA 177

Несложно заметить, что почти во всех представленных результатах имеется интересная комбинация "AGGA". При этом, если мы будем рассматривать лишь те последовательности, в которых данная комбинация содержится, то мы найдем 1663 таких гексамера. Достаточно внушительное число. Это указывает на то, что перед кодирующими последовательностями содержатся последовательности Шайна-Дальгарно, которые нужны для связывания мРНК с 16S РНК при инициации трансляции. https://pubmed.ncbi.nlm.nih.gov/32065583/

Скрипты

Ссылка: коды, использованные для выполнения заданий :-)

Users/lia-mir3112/pr13 (последним исправлял пользователь lia-mir3112 2022-12-21 21:22:09)