Describe Users/vmurashka/pr13 here.
ПРАКТИКУМ 12
Задание 1
старт-кодоны Escherichia coli
- ATG 3883
- ATT 4
- CTG 2
- GTG 334
- TTC 1
- TTG 78
старт-кодоны Candidatus Gracilibacteria bacterium
- ACA 1
- ATG 1129
- GTG 41
- TCA 1
- TCT 1
- TTG 23
старт-кодоны Myciplasma pnemoniae
- ACC 2
- ATA 2
- ATC 3
- ATG 634
- ATT 4
- CTG 4
- GTG 62
- GTT 1
- TTA 2
- TTG 40
1) При связывании ферментов с ДНК третий нуклеотид играет наименьшую роль, поэтому существование старт-кодонов ATC, ATT, ATA было относительно ожидаемо.
2) Возможно, некоторые старт-кодоны встречаются в псевдогенах ("сломанных" генах, не кодирующих белки).
3) Я читала, что генетический код некоторых бактериофагов значительно отличается от "традиционного". Предположу, что гены с нестаднартными старт-кодонами - наследие от подобного бактериофага.
Задание 2
Последовательности в геноме E.coli, в которых стоп-кодоны встречаются не в конце псоледоательности.
lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_1973 [gene=yoeA] [locus_tag=b4582] [db_xref=ASAP:ABE-0285114,ECOCYC:G7075] [protein=CP4-44 prophage; TonB-dependent receptor plug domain-containing protein YoeA] [pseudo=true] [location=join(2068635..2068940,2070277..2070474)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Три из пяти последовательностей кодируют субъединицы фермента формиат-дегидрогеназы, в состав которой входит селеноцистеи (цистеин с замененной на селен серойЮ Эта амикослота кодируется особым образом: стоп-кодоном и следующей за ним особой последовательностью. [1] Другие два содержатся в псевдогенах - генах, которые из-за мутации больше не кодируют белок. Возможно, появление стоп-кодона не в конце последовательности и стало этой "ломающей" мутацией.
Задание 3
Escherichia coli
TGA 1241
TAA 2756
TAG 303
частота TGA 0.2886
частота TAA 0.4739
частота TAG 0.0901
Candidatus Gracilibacteria bacterium
TGA 1
TAA 1000
TAG 188
частота TGA 0.0008
частота TAA 0.4570
частота TAG 0.1366
Myciplasma pnemoniae
TGA 0
TAA 531
TAG 210
частота TGA 0.0000
частота TAA 0.4175
частота TAG 0.2208
"Пропавший" стоп-кодон в геномах Myciplasma pnemoniae и Candidatus Gracilibacteria bacterium (ТГА) часто встречаются не в конце последовательности, поэтому можно предположить, что он кодирует аминокислоты. Действительно, в геноме Myciplasma pnemoniae ТГА кодирует триптофан [2], а у Candidatus Gracilibacteria bacterium - глицин [3]
Задание 4
Escherichia coli
CTA 5201
CTC 14926
CTG 71198
CTT 14719
TTG 18283
TTA 18484
CTA 0.0364
CTC 0.1045
CTG 0.4985
CTT 0.1031
TTG 0.1280
TTA 0.1294
Candidatus Gracilibacteria bacterium
CTA 4861
CTC 4491
CTG 4147
CTT 8053
TTG 8048
TTA 15077
CTA 0.1088
CTC 0.1005
CTG 0.0928
CTT 0.1802
TTG 0.1801
TTA 0.3375
Myciplasma pnemoniae
CTA 3619
CTC 2168
CTG 3220
CTT 5267
TTG 6679
TTA 8959
CTA 0.1210
CTC 0.0725
CTG 0.1076
CTT 0.1761
TTG 0.2233
TTA 0.2995
Согласно гипотезе предпочтения кодонов, разные организмы имеют разные "предпочтения" в выборе из синонимичных аминоксилот. Существует несколько версий, это объясняющих:
1) разные синонимы в разной степени подвержены мутациям (объясняет различия внутри одного генома) [4]
2) частота кодонов модет быть связана с частотой тРНК (это уже объясняет различия между разными бактериями) [5]
Задание 5
минимум: -28,33, индекс - 3 870 000, ему соответствует точка начала репликации (OriC)
максимум: 47,73, индекс - 1 515 000, это точка конца репликации (Ter)
Задание 6
Наиболее часто встречаются 6-меры, соответвующие последовательности Шайна-Дальгарно: AGGAGG, GGAGGA, GGAGGT, GAGGAG. Эти участки находит РНК-полимераза перед реликацией и таким образом "узнает" точку начала.
[1] https://www.elibrary.ru/item.asp?id=15189076
[2] https://www.ncbi.nlm.nih.gov/pmc/articles/PMC146264/
[4] https://pubmed.ncbi.nlm.nih.gov/18983258/
[5] https://www.sciencedirect.com/topics/biochemistry-genetics-and-molecular-biology/codon-usage-bias