= ЗАДАНИЕ 1: =

'''Escherichia coli str. K-12 substr. MG1655:'''

	ATG 3890
        GTG 338
        TTG 80
        ATT 4
        TTC 1 
        CTG 2

'''Candidatus Gracilibacteria bacterium 28_42_T64:'''

	ATG 1129
	GTG 41
	TTG 23
	TCA 1
	ACA 1
	TCT 1

'''Mycoplasma pneumoniae M29:'''

	ATG 629
	GTG 60
	TTG 53
	ATT 8
	ATC 1
	CTG 1
	CTC 2
	ATA 4
	GGA 1
	ACT 1
	CAA 2
	AAA 1
	TTA 3
	GTT 1
	TCT 1
	GAA 1

Почему может использоваться не только ATG старт кодон:

1. Более редкие кодоны не соответствуют комплементарности исходному антикодону(ATG), поэтому появляются реже. Это может быть связано с тем, что гены, которые они кодируют должны проявляться реже, а редкие старт-кодоны являются способом регуляции данной частоты.

2. Некоторые старт-кодоны частично комплементарны антикодону. Так как второй по частоте встречаемости GTG кодон, который похож на ATG, то вероятно он способен выполнять функции старт-кодона, за счет того, что остается частично комплементарным антикодону или же GTG кодон может появиться из-за точечных мутаций.

3. Редкие альтернативные старт-кодоны могут быть особым способом регуляции экспрессии генов.

4. Утрата части последовательности, содержащей ATG или GTG кодоны, может привести к тому, что стартовыми стали следующие за ними кодоны.

= ЗАДАНИЕ 2: =

|| lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]||

|| lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS] ||

|| lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS] ||

|| lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS] ||

Первая последовательность - псевдоген. Стоп кодон находится не на последнем месте так как рамка считывания сбита из-за того, что этот псевдоген являются частью более крупной кодирующей последовательности.

fdnG - формиатдегидрогеназа N

fdoG - формиатдегидрогеназа O 

fdhF - формиатдегидрогеназа H

В них можно найти кодон TGA, который в данном случае не является стоп-кодоном, а кодирует селеноцистеин. 

= ЗАДАНИЕ 3: =

'''Escherichia coli str. K-12 substr. MG1655:'''

	TGA 1246
	TAA 2761
	TAG 306
	ATA 1
	GAA 1

'''Candidatus Gracilibacteria bacterium 28_42_T64:'''

	TGA 1
	TAA 1000
	TAG 188
	TCT 2
	TTA 1
	AAA 1
	CTT 1
	ACA 1
	GAA 1

'''Mycoplasma pneumoniae M29:'''

	TGA 0
	TAA 533
	TAG 221
	ACT 1
	ATA 1
	GGG 4
	AAT 1
	CCC 1
	GGT 1
	GAT 1
	TAT 1
	ATT 1
	TAC 1
	AAA 1
	TTA 1

"Пропавший" стоп-кодон TGA так как он не всегда выполняет функцию стоп кодона. 
Он так же кодирует триптофан (у Mycoplasma pneumoniae M29 https://pubmed.ncbi.nlm.nih.gov/7691196/) 
и глицин (у Candidatus Gracilibacteria https://translated.turbopages.org/proxy_u/en-ru.ru.532fbc49-6584803b-ca56265b-74722d776562/https/pubmed.ncbi.nlm.nih.gov/23509275/)

Можно сделать вывод, что "пропавшими" кодоны могут стать из-за замены функций. В данном случае, это кодирование некоторых аминокислот аминокислот.

= ЗАДАНИЕ 4: =

'''Escherichia coli str. K-12 substr. MG1655:'''

	TAA 2
	CAA 20628
	GAA 53327
	GAG 23896
	TAG 0
	CAG 38834

'''Candidatus Gracilibacteria bacterium 28_42_T64:'''

	TAA 2
	CAA 8888
	GAA 22009
	GAG 6093
	TAG 4
	CAG 1789

'''Mycoplasma pneumoniae M29:'''

	TAA 279
	CAA 9776
	GAA 10862
	GAG 3746
	TAG 128
	CAG 4005


UUA, UUG, CUU, CUC, CUA и CUG - кодоны иРНК кодирующие лейцин

TAA, CAA, GAA, GAG, TAG и CAG - триплеты ДНК кодирующие лейцин

1. Мутации в ДНК могут приводить к изменению частоты использования определенных кодонов.

2. Разные кодоны могут быть связаны с разными  тРНК, и частота их использования может быть разной.

Различия в частоте использования кодонов могут отражать адаптацию бактерий к их среде обитания и функциональные особенности их геномов.

= ЗАДАНИЕ 5: =