Задания с выкладкой
Задание 1.
Escherichia coli str. K-12 substr. MG1655
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Candidatus Gracilibacteria bacterium 28_42_T64
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae M29
AAA 1
ACT 1
ATA 4
ATC 1
ATG 629
ATT 8
CAA 2
CTC 2
CTG 1
GAA 1
GGA 1
GTG 60
GTT 1
TCT 1
TTA 3
TTG 53
Чаще всего встречается старт-кодон ATG. Далее по частоте идут GTG и TTG. Возможно GTG и TTG стали выступать в роли старт-кодонов после мутаций, которые привели к изменению первого нуклеотида стандартного старт-кодона ATG. Появление других старт-кодонов возможно связано с тем, что белки, участвующие в матричном синтезе, способны считывать другие кодоны в качестве старт-кодонов и использовать их в качестве начала синтеза.
Задание 2.
Кодоны встречаются в четырёх последовательностях:
1. [gene=insN][locus_tag=b4587][db_xref=ASAP:ABE-0285253,ECOCYC:G6130][protein=IS911Aregulatorfragment][pseudo=true][location=join(270278..270540,271764..272190)][gbkey=CDS]
Здесь можно увидеть, что кодон находится в псевдогене, то есть не участвует в кодировании.
2. [gene=fdnG][locus_tag=b1474][db_xref=UniProtKB/Swiss-Prot:P24183][protein=formatedehydrogenaseNsubunitalpha][transl_except=(pos:586..588,aa:Sec)][protein_id=AAD13438.1][location=1547401..1550448][gbkey=CDS]
3.[gene=fdoG][locus_tag=b3894][db_xref=UniProtKB/Swiss-Prot:P32176][protein=formatedehydrogenaseOsubunitalpha][transl_except=(pos:586..588,aa:Sec)][protein_id=AAD13456.1][location=complement(4082772..4085822)][gbkey=CDS]
4. [gene=fdhF][locus_tag=b4079][db_xref=UniProtKB/Swiss-Prot:P07658][protein=formatedehydrogenaseH][transl_except=(pos:418..420,aa:Sec)][protein_id=AAD13462.1][location=complement(4297219..4299366)][gbkey=CDS]
Во 2-4 последовательностях так же встречаются стоп-кодоны, но в уже кодирующих белки последовательностях. Вероятно они кодируют какие-то аминокислоты, у которых нет своего кодона в таблице генетического кода.
Задание 3.
Escherichia coli str. K-12 substr. MG1655
TGA 1246
TAA 2761
TAG 306
Candidatus Gracilibacteria bacterium 28_42_T64
TGA - 1
TAA - 1000
TAG - 188
Mycoplasma pneumoniae M29
TGA - 0
TAA - 526
TAG – 220
У Escherichia coli str. K-12 substr. MG1655 "пропал" кодон TAG (его меньше всего). У Candidatus Gracilibacteria bacterium 28_42_T64 и Mycoplasma pneumoniae M29 «потерянным» стоп-кодоном является кодон TGA. Но во всем геноме этот кодон встречается в разы чаще, возможно, эти кодоны выполняют другую функцию. Из найденной информации в интернете можно понять, что у Candidatus Gracilibacteria bacterium кодон TGA кодирует аминокислоту глицин [1], а у Mycoplasma pneumoniae M29 - триптофан [2].
Задание 4.
Escherichia coli str. K-12 substr. MG1655
CTA - 5203
CTC - 14952
CTG - 71305
CTT - 14728
TTA - 18505
TTG - 18301
Candidatus Gracilibacteria bacterium 28_42_T64
CTA - 3357
CTC - 3968
CTG - 1714
CTT - 9333
TTA - 14767
TTG - 3237
Mycoplasma pneumoniae M29
CTA - 2826
CTC - 3158
CTG - 2470
CTT - 2782
TTA - 10295
TTG – 5571
У Mycoplasma pneumoniae M29 и Candidatus Gracilibacteria bacterium 28_42_T64 наиболее часто встречается кодон TTA; у Escherichia coli str. K-12 substr. MG1655 — CTG.
1. Разница частот в пределах одной бактерии может быть связана со степенью экспрессии генов, кодирующих лейцин.
2. При горизонтальном переносе генов, когда геномный материал передаётся от одного организма к другому, некоторые кодоны могут оставаться более сохранёнными, чем другие. Это может привести к повышенной частоте их встречаемости в геноме.
3. У разных же бактерий эта разница возможно связана с количеством соответствующих тРНК, транспортирующих аминокислоту лейцин и распознающих именно CTG.
Задание 5.
Ссылка на график, составленный в Google таблицах:
https://docs.google.com/spreadsheets/d/1werQ_ICUSqqaWNH-EL_vvlub5RBOrRaLSgZvcT6SA8Y/edit?hl=ru#gid=0
С использованием Google таблицы было найдено максимальное и минимальное значение.
Минимум GC-skew cumulative Escherichia coli составил -28.328, и положению минимума GC-skew соответствует место начала репликации и удвоения ДНК.
Максимум GC-skew cumulative Escherichia coli составил 47.733, и положению максимума GC-skew соответствует место окончания репликации.
Литература
[1]. https://febs.onlinelibrary.wiley.com/doi/abs/10.1111/j.1432-1033.1995.192_c.x
[2]. https://www.sciencedirect.com/science/article/pii/037811199390171X
Сопроводительные материалы
Скрипты программ: https://colab.research.google.com/drive/14Ggx76MsMX8f6_vT5emuUHJ9SCBxM_2t?usp=sharing