Задание 1
Escherichia coli str. K-12 substr. MG1655
ATG 3883
GTG 334
TTG 78
ATT 4
CTG 2
TTC 1
Candidatus Gracilibacteria bacterium 28_42_T64
ATG 1129
GTG 41
TTG 23
TCA 1
TCT 1
ACA 1
Mycoplasma pneumoniae M29
ATG 634
GTG 62
TTG 40
ATT 4
CTG 4
ATC 3
ACC 2
ATA 2
TTA 2
GTT 1
У бактерий, кроме кодона AUG, кодирующего метионин, встречаются и другие варианты старт-кодонов. Кодоны GTG и TTG встречаются довольно часто и можно предположить, что они являются часто используемой альтернативой кодону ATG. И их экспрессию клетка может тоньше регулировать. Другие кодоны в большинстве своём являются частью псевдогенов. Либо нормальными генами также с тонкой регуляцией.
Задание 2
Escherichia coli str. K-12 substr. MG1655
[protein=formate dehydrogenase N subunit alpha]
[protein=formate dehydrogenase O subunit alpha]
[protein=formate dehydrogenase H]
Эти последовательности — гены субъединиц формиатдегидрогеназы. В них содержится селеноцистеин. И здесь селеноцистеин кодируется кодоном TGA.
[protein=CP4-6 prophage; IS911A regulator fragment]
А это последовательность псевдогена, ген профага
Задание 3
Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 531
TAG 210
У второй и третьей бактерий TGA не стоп-кодон. Он кодирует аминокислоты глицин и триптофан соответственно
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTA 5201
CTC 14926
CTG 71198
CTT 14719
TTA 18484
TTG 18283
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 4861
CTC 4491
CTG 4147
CTT 8053
TTA 15077
TTG 8048
Mycoplasma pneumoniae M29
CTA 3619
CTC 2168
CTG 3220
CTT 5267
TTA 8959
TTG 6679
1. В бактерии синонимичные кодоны используется с неодинаковой частотой. Возможно, использование разных кодонов зависит от количество определённых тРНК в клетке. Также в кодоне самыми значимыми являются первые два нуклеотида.
2. У разных бактерий частота встречаемости синонимичных кодонов меняется из-за высокой мобильности генома.
Задание 5
Escherichia coli str. K-12 substr. MG1655
График Cumulative GC-skew
Max — 1513000 нуклеотидов — ter
Min — 3870000 нуклеотидов — ori
Задание 6