Практикум 13
Номер 1
Вывод программы для всех 3 бактерий
Escherichia coli
ATG: 3890
ATT: 4
CTG: 2
GTG: 338
TTC: 1
TTG: 80
Candidatus Gracilibacteria bacterium
ACA: 1
ATG: 1129
GTG: 41
TCA: 1
TCT: 1
TTG: 23
Mycoplasma pneumoniae
AAA: 1
ACA: 1
ACT: 1
ATA: 3
ATC: 1
ATG: 627
ATT: 7
CAA: 1
CAC: 1
CTA: 1
CTC: 3
CTG: 2
GAA: 1
GTG: 60
GTT: 1
TCC: 2
TCT: 1
TGA: 1
TTA: 1
TTC: 1
TTG: 49
Наблюдения: Чаще всего представлен старт-кодон ATG; вторым по распространению во всех случаях вариант отличается от ATG на одну мутацию, поэтому можно предположить, что все отклонения от ATG — это просто мутации (в некоторых случаях речь идет о старт-кодоне в псевдогене, который не подвергается экспрессии, а потому и старт-кодон там может быть любым). В других случаях экспрессия белков с отличным от каноничного старт-кодоном происходит из-за других последовательностей, расположенных перед старт-кодоном и играющих во влиянии на экспрессию. Дополнительно ко всему, если мутация единственна и незначительна, то полимераза работает нормально и пропускает ошибку.
Номер 2
Вывод программы для Escherichia coli
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Объяснения: Псевдоген является первым геном, в нём 4 стоп-кодона (2 TAA и 2 TGA), они роли не играют, поскольку он сам не экспрессируется. В оставшихся 3 генах встречается TGA, который кодирует Sec (за которым идёт последовательность нуклеотидов, благодаря которой полимераза вопринимает в качесвте Sec TGA)
Номер 3
Вывод программы для всех 3 бактерий
Escherichia coli
TGA: 1246
TAA: 2761
TAG: 306
Candidatus Gracilibacteria bacterium
TGA: 1
TAA: 1000
TAG: 188
Mycoplasma pneumoniae
TGA: 0
TAA: 526
TAG: 220
Пояснения: У Candidatus Gracilibacteria bacterium и Mycoplasma pneumoniae почти никогда не используется TGA как стоп-кодон, поскольку он ответственен за кодировку Gly либо Trp. Источник: (https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html)
Номер 4
Вывод программы для всех 3 бактерий
Escherichia coli
CTA 5203
CTC 14952
CTG 71305
CTT 14728
TTA 18505
TTG 18301
Candidatus Gracilibacteria bacterium
CTA 4861
CTC 4491
CTG 4147
CTT 8053
TTA 15077
TTG 8048
Mycoplasma pneumoniae
CTA 3505
CTC 2193
CTG 3054
CTT 4623
TTA 9246
TTG 6554
Объяснение: Исходя из результатов, видно, что частота использования кодонов, кодирующих Leu, различается в пределах одной бактерии, а также между бактериями в целом. Скорее всего, такое происходит из-за различий в количестве тРНК и экспрессии генов, а также GC-состава. По итогу, между разными бактериями данное явление объясняется различиями в генетическом коде, в то время как внутри одной бактерии из-за химических свойств нуклеотидов.
Номер 5
Ссылка на график: https://docs.google.com/spreadsheets/d/1OPR_Xupk2jgnoe1uiCi8yCQ-I--RVcLmBohj9ANp6Es/edit?hl=ru#gid=0
Объяснение: Минимум и максимум соответствуют расположению ориджину репликации и терминации репликации, соответсвенно; ориджин репликации располагается в интервале с 1 513 000 по 1 514 000 нуклеотидов, терминация репликации - с 3 870 000 по 3 871 000 нуклеотидов.
Ссылка на коды: https://drive.google.com/drive/folders/1R-CTzbsuPoEGZ_Z6dlXlZ9G8Mo8KRDvU?usp=drive_link