'''~+Задание 1+~''' '''Escherichia coli str. K-12 substr. MG1655'''

ATG 3883

GTG 334

TTG 78

ATT 4

CTG 2

TTC 1

'''Candidatus Gracilibacteria bacterium 28_42_T64'''

ATG 1129

GTG 41

TTG 23

ACA 1

TCA 1

TCT 1

'''Mycoplasma pneumoniae M29'''

ATG 634

GTG 62

TTG 40

ACC 2

CTG 4

ATT 4

ATC 3

TTA 2

ATA 2

GTT 1 -Редкие старт-кодоны,вероятно,нужны для регулирования синтеза некоторых белков. Белки,соответствующие таким кодонам, синтезируются в меньшем количестве, поскольку кодоны инициируются реже (если в старт-кодоне произошла замена одного нуклеотида относительно самого распространенного ATG, то такие старт-кодоны могут встречаться часто.Стоит отметить, что самые редкие старт-кодоны являются псевдогенами. Вероятно, они являются производными функциональных генов, предназначенными для "заморозки" синтеза определенного белка (такие старт-кодоны инициируются редко).

'''~+Задание 2+~'''

'''Последовательности, в которых содержится стоп-кодон НЕ в конце последовательности:'''

lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

Данная последовательность является псевдогеном, бывшей частью профага. Следовательно, можно предположить, что после того, как она утратила функциональное значение, мутации стали возникать с гораздо более высокой вероятностью, поэтому стоп-кодон в последовательности мог возникнуть в ходе мутации.

3 оставшиеся последовательности кодируют формиатдегидрогеназу. В них TGA кодирует селеноцистеин,а не является стоп-кодоном. Следовательно, может находится в любом месте. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

~+'''Задание 3'''+~

1.''Escherichia coli'' str. K-12 substr. MG1655:

а) TAA - 2756

б) TGA - 1241

в) TAG - 303

2.''Candidatus Gracilibacteria bacterium'' 28_42_T64:

а)TAA - 1000

б)TAG - 188

в)TGA - 1

3.''Mycoplasma pneumoniae'' M29:

а)TAA - 531

б)TAG - 210

в)TGA - 0

 . Нетрудно заметить, что у ''Candidatus Gracilibacteria'' TGA встречается всего 1 раз в качестве стоп-кодона, а у ''Mycoplasma pneumoniae'' - 0 . Однако при анализе геномов выяснилось, что встречаемость его в качестве функционального кодона гораздо выше. Следовательно, можно сделать вывод, что он кодирует аминокислоту.
 . '''~+Задание 4+~'''

''Escherichia coli ''str. K-12 substr. MG1655

CTC 14926

CTA 5201

CTG 71198

TTA 18484

TTG 18283

CTT 14719

''Candidatus Gracilibacteria bacterium''28_42_T64

CTC 3968

CTA 3357

CTG 1714

TTA 14767

TTG 3237

CTT 9333

''Mycoplasma pneumoniae'' M29

CTC 3161

CTA 2848

CTG 2473

TTA 10302

TTG 5601

CTT 2798

'''~+Задание 5+~'''

[[https://docs.google.com/spreadsheets/d/1ZLBKmmXOhDZq7AvQcL7hrxmoF79qlLaDNOgRdTFpxmI/edit?usp=sharing| график GC-skew cumulative]]
Точка минимума на графике соответствует началу репликации (origin).
Точка максимума соответствует точке терминации(ter).