Kodomo

Пользователь

Скрипты+График из задания 5

Задание 1

Escherichia coli str. K-12 substr. MG1655

Старт кодон

ATG

ATT

CTG

GTG

TTC

TTG

Встречаемость

3890

4

2

338

1

80

Candidatus Gracilibacteria bacterium 28_42_T64

Старт кодон

ATG

GTG

TTG

TCT

TCA

ACA

Встречаемость

1129

41

23

1

1

1

Mycoplasma pneumoniae M29

Старт кодон

AAA

ACT

ATA

ATC

ATG

ATT

CAA

CTC

CTG

GAA

GGA

GTG

GTT

TCT

TTA

TTG

Встречаемость

1

1

4

1

629

8

2

2

1

1

1

60

1

1

3

53

Самый часто встречаемый старт кодон - ATG. У Mycoplasma pneumoniae M29 встречается большее разнообразие старт-кодонов, чем у остальных исследуемых бактерий. Возможно, что наличие разных старт кодонов связано с необходимостью гена быть более узнаваемым для более частого синтеза соответствующего белка.

Задание 2

Гены, кодирующие белки у E.Coli, в которых стоп-кодоны были найдены не только в конце. Их 4 штуки:

1.lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]

2.lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]

3.lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]

4.lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]

Задание 3

Escherichia coli str. K-12 substr. MG1655

Стоп кодон

TAA

TAG

TGA

GAA

Встречаемость

2761

306

1246

1

Candidatus Gracilibacteria bacterium 28_42_T64

Стоп кодон

TAA

TAG

TGA

Встречаемость

1000

188

1

Mycoplasma pneumoniae M29

Стоп кодон

TAA

TAG

TGA

Встречаемость

533

221

0

у E.Coli Встречаются все базовые стоп-кодоны, у двух других бактерий стоп-кодон TGA практически не встречается. Скорее всего это произошло из-за того, что он предназначен для других целей(кодирование аминокислот). У Candidatus Gracilibacteria bacterium 28_42_T64 TGA кодирует глицин[1]

Задание 4

Escherichia coli str. K-12 substr. MG1655

Кодон

CTG

TTA

TTG

CTC

CTT

CTA

Встречаемость

71305

18505

18301

14952

14728

5203

Candidatus Gracilibacteria bacterium 28_42_T64

Кодон

CTG

TTA

TTG

CTC

CTT

CTA

Встречаемость

1714

14767

3237

3968

9333

3357

Mycoplasma pneumoniae M29

Кодон

CTG

TTA

TTG

CTC

CTT

CTA

Встречаемость

2474

10308

5572

3139

2789

2852

Для первой бактерии содержание нуклеотидов G и C больше, чем A и T. Это связано с тем, что кодон CTG встречается чаще, чем CTA. Разница в частоте встречаемости кодонов в пределах бактерии связана с количеством подходящих транспортных РНК.

Задание 5

Минимум GC-skew cumulative -28.327

Максимум GC-skew cumulative 47.733

[1]-Wrighton KC, Thomas BC, Sharon I, Miller CS, Castelle CJ, VerBerkmoes NC, Wilkins MJ, Hettich RL, Lipton MS, Williams KH, Long PE, Banfield JF. 2012. Fermentation, hydrogen, and sulfur metabolism in multiple uncultivated bacterial phyla. Science 337:1661–1665. doi: 10.1126/science.1224041

Users/gskripachev/pr14 (последним исправлял пользователь gskripachev 2023-12-21 19:28:15)