'''~+Задание 1+~''' '''Escherichia coli str. K-12 substr. MG1655''' ATG 3883 GTG 334 TTG 78 ATT 4 CTG 2 TTC 1 '''Candidatus Gracilibacteria bacterium 28_42_T64''' ATG 1129 GTG 41 TTG 23 ACA 1 TCA 1 TCT 1 '''Mycoplasma pneumoniae M29''' ATG 634 GTG 62 TTG 40 ACC 2 CTG 4 ATT 4 ATC 3 TTA 2 ATA 2 GTT 1 -Редкие старт-кодоны,вероятно,нужны для регулирования синтеза некоторых белков. Белки,соответствующие таким кодонам, синтезируются в меньшем количестве, поскольку кодоны инициируются реже (если в старт-кодоне произошла замена одного нуклеотида относительно самого распространенного ATG, то такие старт-кодоны могут встречаться часто.Стоит отметить, что самые редкие старт-кодоны являются псевдогенами. Вероятно, они являются производными функциональных генов, предназначенными для "заморозки" синтеза определенного белка (такие старт-кодоны инициируются редко). '''~+Задание 2+~''' '''Последовательности, в которых содержится стоп-кодон НЕ в конце последовательности:''' lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS] Данная последовательность является псевдогеном, бывшей частью профага. Следовательно, можно предположить, что после того, как она утратила функциональное значение, мутации стали возникать с гораздо более высокой вероятностью, поэтому стоп-кодон в последовательности мог возникнуть в ходе мутации. 3 оставшиеся последовательности кодируют формиатдегидрогеназу. В них TGA кодирует селеноцистеин,а не является стоп-кодоном. Следовательно, может находится в любом месте. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS] lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS] lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS] ~+'''Задание 3'''+~ 1.''Escherichia coli'' str. K-12 substr. MG1655: а) TAA - 2756 б) TGA - 1241 в) TAG - 303 2.''Candidatus Gracilibacteria bacterium'' 28_42_T64: а)TAA - 1000 б)TAG - 188 в)TGA - 1 3.''Mycoplasma pneumoniae'' M29: а)TAA - 531 б)TAG - 210 в)TGA - 0 . Нетрудно заметить, что у ''Candidatus Gracilibacteria'' TGA встречается всего 1 раз в качестве стоп-кодона, а у ''Mycoplasma pneumoniae'' - 0 . Однако при анализе геномов выяснилось, что встречаемость его в качестве функционального кодона гораздо выше. Следовательно, можно сделать вывод, что он кодирует аминокислоту. . '''~+Задание 4+~''' ''Escherichia coli ''str. K-12 substr. MG1655 CTC 14926 CTA 5201 CTG 71198 TTA 18484 TTG 18283 CTT 14719 ''Candidatus Gracilibacteria bacterium''28_42_T64 CTC 3968 CTA 3357 CTG 1714 TTA 14767 TTG 3237 CTT 9333 ''Mycoplasma pneumoniae'' M29 CTC 3161 CTA 2848 CTG 2473 TTA 10302 TTG 5601 CTT 2798 '''~+Задание 5+~''' [[https://docs.google.com/spreadsheets/d/1ZLBKmmXOhDZq7AvQcL7hrxmoF79qlLaDNOgRdTFpxmI/edit?usp=sharing| график GC-skew cumulative]] Точка минимума на графике соответствует началу репликации (origin). Точка максимума соответствует точке терминации(ter).