== Задание 1 == Escherichia coli str. K-12 substr. MG1655 ATG 3883 ATT 4 CAG 0 CTG 2 GTG 334 TTG 78 TTC 1 Candidatus Gracilibacteria bacterium 28_42_T64 ACA 1 ATG 1129 . ATT 0 . CAG 0 . CTG 0 . GTG 41 . TTG 23 . TCA 1 . TCT 1 . Mycoplasma pneumoniae M29 ACC 2 ATA 2 ATC 3 ATG 634 ATT 4 CTG 4 GTG 62 GTT 1 TTA 2 Наблюдается тенденция к использованию в качестве старт-кодона ATG,что может быть связано с прочными связями,образующимися между последовательностью и тРНК.ATG и GTG похожи по структуре:оба содержат два пурина,отличия между котрыми незначительны.Наиболее распространен ATG,возможно,из-за случайного преобладания аденина перед гуанином в начале эволюции. Третий кодон наиболее вариабельный. Видно,что помимо ATG используются и другие кодоны в виде стартового,это может быть из-за: *возможных мутаций старт-кодона * использования в регуляции экспрессии генов,что применяется бактерией в неблагоприятных условиях.При активации/репрессии синтеза белков * === Задание 2 === lcl|U00096.3_cds_249 [gene=insN] [protein=CP4-6 prophage; IS911A regulator fragment] [pseudo=true] lcl|U00096.3_cds_1973 [gene=yoeA] [protein=CP4-44 prophage; TonB-dependent receptor plug domain-containing protein YoeA] [pseudo=true] Последовательности соответсвуют псевдогену,возможно,образовавшемуся из-за встраивания транспозона в ген бактериофага,у котрого кодон был кодирующим,или вследствие мутации. lcl|U00096.3_cds_AAD13438.1_1457 [gene=fdnG] [protein=formate dehydrogenase N subunit alpha] lcl|U00096.3_cds_AAD13456.1_3815 [gene=fdoG] [protein=formate dehydrogenase O subunit alpha] lcl|U00096.3_cds_AAD13462.1_3987 [gene=fdhF] [protein=formate dehydrogenase H] В оставшихся последовательностях кодируется формиатдегидрогеназа - она содержит селеноцистеин,который не имеет своего кода ,поэтому кодируется TGA === Задание 3 === ''Escherichia coli str. K-12 substr. MG1655 '' TGA 1241 TAA 2756 TAG 303 ''С Gracilibacteria bacterium 28_42_T64'' TGA 1 TAA 1000 TAG 188 ''Mycoplasma pneumoniae M29 '' TGA 0 TAA 531 TAG 210 У 2 и 3 бактерии TGA кодирует аминокислоты,не являясь стоп-кодоном:у второй кодируется глицин (1),а у третьей -триптофан(2). (1) [[https://www.science.org/doi/abs/10.1126/science.1250691|Stop codon reassignments in the wild (science.org)]] (2) [[https://journals.asm.org/doi/abs/10.1128/jcm.33.3.680-683.1995|Recombinant 46-kilodalton surface antigen (P46) of Mycoplasma hyopneumoniae expressed in Escherichia coli can be used for early specific diagnosis of mycoplasmal pneumonia of swine by enzyme-linked immunosorbent assay | Journal of Clinical Microbiology]] === Задание 4 === ''Escherichia coli str. K-12 substr. MG1655 '' CTA 5201 CTC 14926 CTG 71198 CTT 14719 TTA 18484 TTG 18283 ''Candidatus Gracilibacteria bacterium 28_42_T64 '' CTA 3357 CTC 3968 CTG 1714 CTT 9333 TTA 14767 TTG 3237 ''Mycoplasma pneumoniae M29 '' CTA 2848 CTC 3161 CTG 2473 CTT 2798 TTA 10302 TTG 5601 1.В одной бактерии кодоны для одной аминокислоты используются с разной частотой,что связано с большей устойчивостью кодонов, заканчиваюшихся на пурины.Разная частота повышает устойчивость бактерии к патогенам,помогает избежать ошибок в репликации-при мутации просто используется другой кодон,который кодирует ту же аминокислоту.Так же частоты кодонов зависят от последствий в них мутаций-изменится ли аминокислота или нет.Обычно третий нуклеотид наиболее вариабельный. 2.Изменение частоты у разных бактерий происходит из-за мутаций ,а также из-за различий в генетическом коде === Задание 5 === минимум-3869000 максимум - 1468000,0 [[https://docs.google.com/spreadsheets/d/1S0bUtx-uwE1KHQprBF9eQH_0ROkwk5KTDgyLRkIOIqo/edit#gid=1069807506|график - Google Таблицы]] Минимуму GC-skew cumulative соответствует ориджин репликации, максимуму - точка конца репликации,месту ,где две репликационные вилки встречаются. Положение минимума из данных соответствует информации на GenBank (3925744-3925975). === Задание 6 === Частота 6-меров: AAAAAA 175 AAGGAG 177 ATGAAA 273 TGAAAA 195 GAAAAA 187 Часто встречаются 6-Kмеры ,соответствующие последовательности Шайна-Дальгарно,куда садится рибосома при синтезе белка.Она расположена обычно на 10 нуклеотидов до стартового кодона.