Задание 1 Escherichia coli str. K-12 substr. MG1655
ATG 3883
GTG 334
TTG 78
ATT 4
CTG 2
TTC 1
Candidatus Gracilibacteria bacterium 28_42_T64
ATG 1129
GTG 41
TTG 23
ACA 1
TCA 1
TCT 1
Mycoplasma pneumoniae M29
ATG 634
GTG 62
TTG 40
ACC 2
CTG 4
ATT 4
ATC 3
TTA 2
ATA 2
GTT 1 -Редкие старт-кодоны,вероятно,нужны для регулирования синтеза некоторых белков. Белки,соответствующие таким кодонам, синтезируются в меньшем количестве, поскольку кодоны инициируются реже (если в старт-кодоне произошла замена одного нуклеотида относительно самого распространенного ATG, то такие старт-кодоны могут встречаться часто.Стоит отметить, что самые редкие старт-кодоны являются псевдогенами. Вероятно, они являются производными функциональных генов, предназначенными для "заморозки" синтеза определенного белка (такие старт-кодоны инициируются редко).
Задание 2
Последовательности, в которых содержится стоп-кодон НЕ в конце последовательности:
lcl|U00096.3_cds_249 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
Данная последовательность является псевдогеном, бывшей частью профага. Следовательно, можно предположить, что после того, как она утратила функциональное значение, мутации стали возникать с гораздо более высокой вероятностью, поэтому стоп-кодон в последовательности мог возникнуть в ходе мутации.
3 оставшиеся последовательности кодируют формиатдегидрогеназу. В них TGA кодирует селеноцистеин,а не является стоп-кодоном. Следовательно, может находится в любом месте. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Задание 3
1.Escherichia coli str. K-12 substr. MG1655:
а) TAA - 2756
б) TGA - 1241
в) TAG - 303
2.Candidatus Gracilibacteria bacterium 28_42_T64:
а)TAA - 1000
б)TAG - 188
в)TGA - 1
3.Mycoplasma pneumoniae M29:
а)TAA - 531
б)TAG - 210
в)TGA - 0
Нетрудно заметить, что у Candidatus Gracilibacteria TGA встречается всего 1 раз в качестве стоп-кодона, а у Mycoplasma pneumoniae - 0 . Однако при анализе геномов выяснилось, что встречаемость его в качестве функционального кодона гораздо выше. Следовательно, можно сделать вывод, что он кодирует аминокислоту.
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTC 14926
CTA 5201
CTG 71198
TTA 18484
TTG 18283
CTT 14719
Candidatus Gracilibacteria bacterium28_42_T64
CTC 3968
CTA 3357
CTG 1714
TTA 14767
TTG 3237
CTT 9333
Mycoplasma pneumoniae M29
CTC 3161
CTA 2848
CTG 2473
TTA 10302
TTG 5601
CTT 2798
Задание 5
график GC-skew cumulative Точка минимума на графике соответствует началу репликации (origin). Точка максимума соответствует точке терминации(ter).