Результаты практикума№13
Задание 1
Escherichia coli str. K-12 substr. MG1655
ATG 3883
ATT 4
CTG 2
GTG 334
TTC 1
TTG 78
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 2
Mycoplasma pneumoniae M29
ACC 2
ATA 2
ATC 3
ATG 634
ATT 4
CTG 4
GTG 62
GTT 1
TTA 2
TTG 40
Причиной использования "нетипичных" старт-кодонов скорее всего являются точечные мутации, приведшие к замене одного или нескольких нуклеотидов. Например, довольно часто встречающийся GTG мог образоваться результате A-->G замены (замены пурина на пурин).
Задание 2
Было обнаружено четыре последовательности:
(1) псевдоген профага; возможно, стоп-кодон появился в результате точечной мутации
(2)-(4) субъединицы фермента дегидрогеназы, в состав которого входит "21-я" аминокислота – селеноцистеин; селеноцистеин кодируется стоп-кодоном, если за ним следует особая нуклеотидная последовательность
Задание 3
Escherichia coli str. K-12 substr. MG1655
TGA 1241
TAA 2756
TAG 303
Candidatus Gracilibacteria bacterium 28_42_T64
TGA 1
TAA 999
TAG 188
Mycoplasma pneumoniae M29
TGA 0
TAA 515
TAG 206
У второй и третей бактерии практически не встречается стоп-кодон TGA. Это связано с тем, что у этих бактерий TGA не является стоп-кодон, а кодирует аминокислоты: тритофан у M. pneumoniae и глицин у Candidatus Gracilibacteria bacterium. Источник: https://www.frontiersin.org/articles/10.3389/fmicb.2014.00231/full
Задание 4
Escherichia coli str. K-12 substr. MG1655
CTA 5201 3.64%
CTC 14926 10.45%
CTG 71198 49.85%
CTT 14719 10.31%
TTA 18484 12.94%
TTG 18283 12.80%
Candidatus Gracilibacteria bacterium 28_42_T64
CTA 4861 10.88%
CTC 4491 10.05%
CTG 4147 9.28%
CTT 8053 18.02%
TTA 15077 33.75%
TTG 8048 18.01%
Mycoplasma pneumoniae M29
CTA 3619 12.10%
CTC 2168 7.25%
CTG 3220 10.76%
CTT 5267 17.61%
TTA 8959 29.95%
TTG 6679 22.33%
Предпочтение кодонов может быть связано с давлением отбора (кодоны по-разному влияют на эффективность экспрессии генов) или с частотой мутаций, которая различна для каждого кодона. Источник: https://www.annualreviews.org/doi/10.1146/annurev.genet.42.110807.091442
Исходя из этого, могу предположить, что различие в предпочтении кодов между разными бактериями связано с различием в их метаболизме, процессах экспрессии генов, средах обитания и т.д. Т.к. от этих факторов зависит направление давления отбора и частота и типы мутаций.
Задание 5
График cumulative GC-skew: по ссылке
Координата минимального знания cumulative GC-skew примерно соответствует точке ориджина репликации: 3870000 vs 3,925,744 (источник: https://biocyc.org/ECOLI/NEW-IMAGE?type=EXTRAGENIC-SITE&object=G0-10506])
Координата максимального значения примерном соответсвует точке терминации. Координата: 1513000.