Домашняя работа 14
Скрипты, которые я использовал https://github.com/anichun/hw13
Номер 1
Результаты вывода:
Escherichia coli
ATG: 3890
ATT: 4
CTG: 2
GTG: 338
TTC: 1
TTG: 80
Candidatus Gracilibacteria bacterium
ACA: 1
ATG: 1129
GTG: 41
TCA: 1
TCT: 1
TTG: 23
Mycoplasma pneumoniae
AAA: 1
ACA: 1
ACT: 1
ATA: 3
ATC: 1
ATG: 627
ATT: 7
CAA: 1
CAC: 1
CTA: 1
CTC: 3
CTG: 2
GAA: 1
GTG: 60
GTT: 1
TCC: 2
TCT: 1
TGA: 1
TTA: 1
TTC: 1
TTG: 49
Номер 2
Вывод программы :
lcl|U00096.3_cds_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Комментарий
Первый ген — псевдоген(он, очевидно, не экспрессируется) и в нем сразу четыре стоп-кодона: два TAA и два TGA
В остальных трех генах в рамке считывания встречается TGA, но он кодирует не стоп-кодон, а селеноцистеин.
Номер 3
Результаты вывода :
Escherichia coli
TGA: 1246
TAA: 2761
TAG: 306
Candidatus Gracilibacteria bacterium
TGA: 1
TAA: 1000
TAG: 188
Mycoplasma pneumoniae
TGA: 0
TAA: 526
TAG: 220
Номер 4
Escherichia coli
TTA 18505
TTG 18301
CTA 5203
CTG 71305
CTC 14952
CTT 14728
Candidatus Gracilibacteria bacterium
TTA 33582
TTG 26349
CTA 10064
CTG 75452
CTC 19443
CTT 22781
Mycoplasma pneumoniae
TTA 42828
TTG 32903
CTA 13569
CTG 78506
CTC 21636
CTT 27404
Комментарий
У одной и той же бактерии синонимичные кодоны используются с разной частотой, а потому и частоты для разных бактерий (особенно неродственных) будут отличаться. Возможно, это связано с количеством соответствующих транспортных РНК в клетке.