= Результаты практикума№13 =
== Задание 1 ==

'''Escherichia coli str. K-12 substr. MG1655'''


ATG 3883

ATT 4

CTG 2

GTG 334

TTC 1

TTG 78



'''Candidatus Gracilibacteria bacterium 28_42_T64'''


ACA 1

ATG 1129

GTG 41

TCA 1

TCT 1

TTG 2


'''Mycoplasma pneumoniae M29'''


ACC 2

ATA 2

ATC 3

ATG 634

ATT 4

CTG 4

GTG 62

GTT 1

TTA 2

TTG 40

Причиной использования "нетипичных" старт-кодонов скорее всего являются точечные мутации, приведшие к замене одного или нескольких нуклеотидов. Например, довольно часто встречающийся GTG мог образоваться  результате A-->G замены (замены пурина на пурин).


== Задание 2 ==

Было обнаружено четыре последовательности:

(1) псевдоген профага; возможно, стоп-кодон появился в результате точечной мутации 

(2)-(4) субъединицы фермента дегидрогеназы, в состав которого входит "21-я" аминокислота -- селеноцистеин; селеноцистеин кодируется стоп-кодоном, если за ним следует особая нуклеотидная последовательность 

== Задание 3 ==


'''Escherichia coli str. K-12 substr. MG1655'''


TGA 1241

TAA 2756

TAG 303



'''Candidatus Gracilibacteria bacterium 28_42_T64'''


TGA 1

TAA 999

TAG 188



'''Mycoplasma pneumoniae M29'''


TGA 0

TAA 515

TAG 206


У второй и третей бактерии практически не встречается стоп-кодон TGA. Это связано с тем, что у этих бактерий TGA не является стоп-кодон, а кодирует аминокислоты: тритофан у M. pneumoniae и глицин у Candidatus Gracilibacteria bacterium.
Источник: [[https://www.frontiersin.org/articles/10.3389/fmicb.2014.00231/full]]
== Задание 4 ==

'''Escherichia coli str. K-12 substr. MG1655'''


CTA 5201 3.64%

CTC 14926 10.45%

CTG 71198 49.85%

CTT 14719 10.31%

TTA 18484 12.94%

TTG 18283 12.80%


'''Candidatus Gracilibacteria bacterium 28_42_T64'''


CTA 4861 10.88%

CTC 4491 10.05%

CTG 4147 9.28%

CTT 8053 18.02%

TTA 15077 33.75%

TTG 8048 18.01%


'''Mycoplasma pneumoniae M29'''


CTA 3619 12.10%

CTC 2168 7.25%

CTG 3220 10.76%

CTT 5267 17.61%

TTA 8959 29.95%

TTG 6679 22.33%

Предпочтение кодонов может быть связано с давлением отбора (кодоны по-разному влияют на эффективность экспрессии генов) или с частотой мутаций, которая различна для каждого кодона. Источник: [[https://www.annualreviews.org/doi/10.1146/annurev.genet.42.110807.091442]]

Исходя из этого, могу предположить, что различие в предпочтении кодов между разными бактериями связано с различием в их метаболизме, процессах экспрессии генов, средах обитания и т.д. Т.к. от этих факторов зависит направление давления отбора и частота и типы мутаций.

== Задание 5 ==

График cumulative GC-skew: [[https://docs.google.com/spreadsheets/d/19hWboaJTxHrDnqKKxuQVxdxZhxdFrpp8tjc_g6Hg25k/edit?usp=sharing|по ссылке]]

Координата минимального знания cumulative GC-skew примерно соответствует точке ориджина репликации: 3870000 vs 3,925,744 (источник: [[https://biocyc.org/ECOLI/NEW-IMAGE?type=EXTRAGENIC-SITE&object=G0-10506]]])

Координата максимального значения примерном соответсвует точке терминации. Координата: 1513000.