ЗАДАНИЕ 1:
Escherichia coli str. K-12 substr. MG1655:
- ATG 3890 GTG 338 TTG 80 ATT 4 TTC 1 CTG 2
Candidatus Gracilibacteria bacterium 28_42_T64:
- ATG 1129 GTG 41 TTG 23 TCA 1 ACA 1 TCT 1
Mycoplasma pneumoniae M29:
- ATG 629 GTG 60 TTG 53 ATT 8 ATC 1 CTG 1 CTC 2 ATA 4 GGA 1 ACT 1 CAA 2 AAA 1 TTA 3 GTT 1 TCT 1 GAA 1
Почему может использоваться не только ATG старт кодон:
1. Более редкие кодоны не соответствуют комплементарности исходному антикодону(ATG), поэтому появляются реже. Это может быть связано с тем, что гены, которые они кодируют должны проявляться реже, а редкие старт-кодоны являются способом регуляции данной частоты.
2. Некоторые старт-кодоны частично комплементарны антикодону. Так как второй по частоте встречаемости GTG кодон, который похож на ATG, то вероятно он способен выполнять функции старт-кодона, за счет того, что остается частично комплементарным антикодону или же GTG кодон может появиться из-за точечных мутаций.
3. Редкие альтернативные старт-кодоны могут быть особым способом регуляции экспрессии генов.
4. Утрата части последовательности, содержащей ATG или GTG кодоны, может привести к тому, что стартовыми стали следующие за ними кодоны.
ЗАДАНИЕ 2:
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS] |
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS] |
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS] |
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS] |
Первая последовательность - псевдоген. Стоп кодон находится не на последнем месте так как рамка считывания сбита из-за того, что этот псевдоген являются частью более крупной кодирующей последовательности.
fdnG - формиатдегидрогеназа N
fdoG - формиатдегидрогеназа O
fdhF - формиатдегидрогеназа H
В них можно найти кодон TGA, который в данном случае не является стоп-кодоном, а кодирует селеноцистеин.
ЗАДАНИЕ 3:
Escherichia coli str. K-12 substr. MG1655:
- TGA 1246 TAA 2761 TAG 306 ATA 1 GAA 1
Candidatus Gracilibacteria bacterium 28_42_T64:
- TGA 1 TAA 1000 TAG 188 TCT 2 TTA 1 AAA 1 CTT 1 ACA 1 GAA 1
Mycoplasma pneumoniae M29:
- TGA 0 TAA 533 TAG 221 ACT 1 ATA 1 GGG 4 AAT 1 CCC 1 GGT 1 GAT 1 TAT 1 ATT 1 TAC 1 AAA 1 TTA 1
"Пропавший" стоп-кодон TGA так как он не всегда выполняет функцию стоп кодона. Он так же кодирует триптофан (у Mycoplasma pneumoniae M29 https://pubmed.ncbi.nlm.nih.gov/7691196/) и глицин (у Candidatus Gracilibacteria https://translated.turbopages.org/proxy_u/en-ru.ru.532fbc49-6584803b-ca56265b-74722d776562/https/pubmed.ncbi.nlm.nih.gov/23509275/)
Можно сделать вывод, что "пропавшими" кодоны могут стать из-за замены функций. В данном случае, это кодирование некоторых аминокислот аминокислот.
ЗАДАНИЕ 4:
Escherichia coli str. K-12 substr. MG1655:
- TAA 2 CAA 20628 GAA 53327 GAG 23896 TAG 0 CAG 38834
Candidatus Gracilibacteria bacterium 28_42_T64:
- TAA 2 CAA 8888 GAA 22009 GAG 6093 TAG 4 CAG 1789
Mycoplasma pneumoniae M29:
- TAA 279 CAA 9776 GAA 10862 GAG 3746 TAG 128 CAG 4005
UUA, UUG, CUU, CUC, CUA и CUG - кодоны иРНК кодирующие лейцин
TAA, CAA, GAA, GAG, TAG и CAG - триплеты ДНК кодирующие лейцин
1. Мутации в ДНК могут приводить к изменению частоты использования определенных кодонов.
2. Разные кодоны могут быть связаны с разными тРНК, и частота их использования может быть разной.
Различия в частоте использования кодонов могут отражать адаптацию бактерий к их среде обитания и функциональные особенности их геномов.