Практикум 13
Задание 1
Результаты
Escherichia coli:
ATG 3890
ATT 4
CTG 2
GTG 338
TTC 1
TTG 80
Candidatus Gracilibacteria:
ACA 1
ATG 1129
GTG 41
TCA 1
TCT 1
TTG 23
Mycoplasma pneumoniae:
AAA 1
ACA 1
ACT 1
ATA 3
ATC 1
ATG 626
ATT 7
CAA 1
CAC 1
CTA 1
CTC 3
CTG 2
GAA 1
GTG 60
GTT 1
TCC 2
TCT 1
TGA 1
TTA 2
TTC 1
TTG 49
Объяснение
Все отличающиеся от стандартного "ATG" старт кодоны делились на 2 группы: отличающиеся от "ATG" на 1 нуклеотид и на несколько. Старт-кодоны из второй группы встречались почти только в псевдогенах, что можно объяснить накопившимися мутациями (такие мутации не привели к гибели организма, поскольку данный участок ДНК не принимал участие в трансляции). Старт-кодоны из первой группы встречались и в обычных генах. Возможно, что у бактерий используются различные транспортные РНК, требующие различных "типов" инициации трансляции.
Задание 2
Результаты
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
Объяснение
Вероятно, стоп-кодоны в последних 3 генах выполняют не функцию терминации транскрипции, а кодируют аминокислоты (ген кодирует формиат дегидрогеназу, стоп кодон в нём кодирует аминокислоту селеноцистеин). А первый ген является псевдогеном, поэтому стоп-кодон внутри его последовательности можно объяснить случайной мутацией. [1]F. ZINONI, J. HEIDER, AND A. BOCK, "Features of the formate dehydrogenase mRNA necessary for decoding of the UGA codon as selenocysteine"
Задание 3
Результаты
Escherichia coli:
ATA 1
GAA 1
TAA 2761
TAG 306
TGA 1246
Candidatus Gracilibacteria:
AAA 1
ACA 1
CTT 1
GAA 1
TAA 1000
TAG 188
TCT 2
TGA 1
TTA 1
Mycoplasma pneumoniae:
AAA 1
AAT 1
ACT 1
ATA 1
CCC 1
CGG 1
CTA 1
GAT 1
GGC 1
GGG 5
GGT 3
TAA 526
TAC 1
TAG 220
TAT 1
TTA 1
Объяснение
Кодон "TGA" у второй и третьей бактерий является кодирующим (кодируют глицин и триптофан соответственно)и не терминирует транскрипцию
[2] UGA is an additional glycine codon in unculturedSR1 bacteria from the human microbiota
[3] https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/index.cgi?chapter=cgencodes#SG25
[4] https://www.ncbi.nlm.nih.gov/Taxonomy/taxonomyhome.html/index.cgi?chapter=cgencodes#SG4
Задание 4
Результаты
Escherichia coli:
CTA 5203
CTC 14952
CTG 71305
CTT 14728
TTA 18505
TTG 18301
Candidatus Gracilibacteria:
CTA 4861
CTC 4491
CTG 4147
CTT 8053
TTA 15077
TTG 8048
Mycoplasma pneumoniae:
CTA 3505
CTC 2193
CTG 3054
CTT 4623
TTA 9246
TTG 6554
Объяснение
1. Распределение кодонов, кодирующих лейцин, неравномерное. Данное явление получило название "смещение использования кодонов" (codon usage bias). В его возникновении ключевую роль играют 2 фактора: случайные мутации и естественный отбор. И если влияние случайных мутаций... случайное, как это не удивительно, то ситуация с отбором более интересная. Несмотря на то, что синонимичные кодоны не влияют на последовательность аминокислот в белке, они могут оказывать влияние на стабильность матричной РНК, переносящей информацию к рибосоме. Также от кодона зависит скорость связывания антикодона, A-сайта рибосомы и мРНК. Кроме того, различные кодоны по-разному влияют на движение и взаимное расположение рибосомы и мРНК во время трансляции, что также может сказываться на конформации белка. [5] Mitra S, Ray SK, Banerjee R, Synonymous codons influencing gene expression in organisms
2. Разница для разных бактерий обусловлена различными условиями окружающей среды, что, как написано в пункте 1, приводит к естественному отбору в разных направлениях у разных бактерий.
Задание 5
Результаты
""Представлены на гугл-диске""
Объяснение
Точки максимума и минимума cumulative GC skew совпадают с сайтами начала и окончания транскрипции [6] Nucleic Acids Research, Том 26, Издание 10, 1 Май 1998, страницы 2286–2290
Задание 6
Результаты
""Представлены на гугл-диске""
Объяснение
Как видно из данных, распределение по частоте встречаемости коррелирует с отклонением от "оптимальной" последовательности Шайна-Дальгарно. Это объясняется тем, что последовательности Шайна-Дальгарно и комплементарная ей участвуют в присоединении мРНК к P-сайту рибосомы и начале синтеза белка. И чем меньше комплиментарных оснований, тем менее эффективна трансляция, так как такое присоединение затруднено.
Гугл диск с результатами и кодами
https://drive.google.com/drive/folders/1dgwx7NOoXPLxmk8j6HmJhueoceR2J44l?usp=share_link