Задание 1
Escherichia coli str. K-12 substr. MG1655
ATG 3883
ATT 4
CAG 0
CTG 2
GTG 334
TTG 78
TTC 1
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
- ATT 0
- CAG 0
- CTG 0
- GTG 41
- TTG 23
- TCA 1
- TCT 1
Mycoplasma pneumoniae M29
ACC 2
ATA 2
ATC 3
ATG 634
ATT 4
CTG 4
GTG 62
GTT 1
TTA 2
Наблюдается тенденция к использованию в качестве старт-кодона ATG,что может быть связано с прочными связями,образующимися между последовательностью и тРНК.ATG и GTG похожи по структуре:оба содержат два пурина,отличия между котрыми незначительны.Наиболее распространен ATG,возможно,из-за случайного преобладания аденина перед гуанином в начале эволюции.
Третий кодон наиболее вариабельный.
Видно,что помимо ATG используются и другие кодоны в виде стартового,это может быть из-за:
*возможных мутаций старт-кодона
- использования в регуляции экспрессии генов,что применяется бактерией в неблагоприятных условиях.При активации/репрессии синтеза белков
Задание 2
lcl|U00096.3_cds_249 [gene=insN] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true]
lcl|U00096.3_cds_1973 [gene=yoeA] [protein=CP4-44 prophage; TonB-dependent receptor plug domain-containing protein YoeA] [pseudo=true]
Последовательности соответсвуют псевдогену,возможно,образовавшемуся из-за встраивания транспозона в ген бактериофага,у котрого кодон был кодирующим,или вследствие мутации.
lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [protein=formate dehydrogenase N subunit alpha]
lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [protein=formate dehydrogenase O subunit alpha]
lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [protein=formate dehydrogenase H]
В оставшихся последовательностях кодируется формиатдегидрогеназа - она содержит селеноцистеин,который не имеет своего кода ,поэтому кодируется TGA
Задание 3
Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
С Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 1000
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 531
TAG 210
У 2 и 3 бактерии TGA кодирует аминокислоты,не являясь стоп-кодоном:у второй кодируется глицин (1),а у третьей -триптофан(2).
(1) Stop codon reassignments in the wild (science.org)
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTA 5201
CTC 14926
CTG 71198
CTT 14719
TTA 18484
TTG 18283
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 3357
CTC 3968
CTG 1714
CTT 9333
TTA 14767
TTG 3237
Mycoplasma pneumoniae M29
CTA 2848
CTC 3161
CTG 2473
CTT 2798
TTA 10302
TTG 5601
1.В одной бактерии кодоны для одной аминокислоты используются с разной частотой,что связано с большей устойчивостью кодонов, заканчиваюшихся на пурины.Разная частота повышает устойчивость бактерии к патогенам,помогает избежать ошибок в репликации-при мутации просто используется другой кодон,который кодирует ту же аминокислоту.Так же частоты кодонов зависят от последствий в них мутаций-изменится ли аминокислота или нет.Обычно третий нуклеотид наиболее вариабельный.
2.Изменение частоты у разных бактерий происходит из-за мутаций ,а также из-за различий в генетическом коде
Задание 5
минимум-3869000
максимум - 1468000,0
Минимуму GC-skew cumulative соответствует ориджин репликации, максимуму - точка конца репликации,месту ,где две репликационные вилки встречаются.
Положение минимума из данных соответствует информации на GenBank (3925744-3925975).
Задание 6
Частота 6-меров:
AAAAAA 175
AAGGAG 177
ATGAAA 273
TGAAAA 195
GAAAAA 187
Часто встречаются 6-Kмеры ,соответствующие последовательности Шайна-Дальгарно,куда садится рибосома при синтезе белка.Она расположена обычно на 10 нуклеотидов до стартового кодона.