Задание 1
Escherichia coli str. K-12 substr. MG1655
Старт кодон |
ATG |
ATT |
CTG |
GTG |
TTC |
TTG |
Встречаемость |
3890 |
4 |
2 |
338 |
1 |
80 |
Candidatus Gracilibacteria bacterium 28_42_T64
Старт кодон |
ATG |
GTG |
TTG |
TCT |
TCA |
ACA |
Встречаемость |
1129 |
41 |
23 |
1 |
1 |
1 |
Mycoplasma pneumoniae M29
Старт кодон |
AAA |
ACT |
ATA |
ATC |
ATG |
ATT |
CAA |
CTC |
CTG |
GAA |
GGA |
GTG |
GTT |
TCT |
TTA |
TTG |
Встречаемость |
1 |
1 |
4 |
1 |
629 |
8 |
2 |
2 |
1 |
1 |
1 |
60 |
1 |
1 |
3 |
53 |
Самый часто встречаемый старт кодон - ATG. У Mycoplasma pneumoniae M29 встречается большее разнообразие старт-кодонов, чем у остальных исследуемых бактерий. Возможно, что наличие разных старт кодонов связано с необходимостью гена быть более узнаваемым для более частого синтеза соответствующего белка.
Задание 2
Гены, кодирующие белки у E.Coli, в которых стоп-кодоны были найдены не только в конце. Их 4 штуки:
1.lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
2.lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
3.lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
4.lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Задание 3
Escherichia coli str. K-12 substr. MG1655
Стоп кодон |
TAA |
TAG |
TGA |
GAA |
Встречаемость |
2761 |
306 |
1246 |
1 |
Candidatus Gracilibacteria bacterium 28_42_T64
Стоп кодон |
TAA |
TAG |
TGA |
Встречаемость |
1000 |
188 |
1 |
Mycoplasma pneumoniae M29
Стоп кодон |
TAA |
TAG |
TGA |
Встречаемость |
533 |
221 |
0 |
у E.Coli Встречаются все базовые стоп-кодоны, у двух других бактерий стоп-кодон TGA практически не встречается. Скорее всего это произошло из-за того, что он предназначен для других целей(кодирование аминокислот). У Candidatus Gracilibacteria bacterium 28_42_T64 TGA кодирует глицин[1]
Задание 4
Escherichia coli str. K-12 substr. MG1655
Кодон |
CTG |
TTA |
TTG |
CTC |
CTT |
CTA |
Встречаемость |
71305 |
18505 |
18301 |
14952 |
14728 |
5203 |
Candidatus Gracilibacteria bacterium 28_42_T64
Кодон |
CTG |
TTA |
TTG |
CTC |
CTT |
CTA |
Встречаемость |
1714 |
14767 |
3237 |
3968 |
9333 |
3357 |
Mycoplasma pneumoniae M29
Кодон |
CTG |
TTA |
TTG |
CTC |
CTT |
CTA |
Встречаемость |
2474 |
10308 |
5572 |
3139 |
2789 |
2852 |
Для первой бактерии содержание нуклеотидов G и C больше, чем A и T. Это связано с тем, что кодон CTG встречается чаще, чем CTA. Разница в частоте встречаемости кодонов в пределах бактерии связана с количеством подходящих транспортных РНК.
Задание 5
Минимум GC-skew cumulative -28.327
Максимум GC-skew cumulative 47.733
[1]-Wrighton KC, Thomas BC, Sharon I, Miller CS, Castelle CJ, VerBerkmoes NC, Wilkins MJ, Hettich RL, Lipton MS, Williams KH, Long PE, Banfield JF. 2012. Fermentation, hydrogen, and sulfur metabolism in multiple uncultivated bacterial phyla. Science 337:1661–1665. doi: 10.1126/science.1224041