ПРАКТИКУМ НОМЕР 13
Файл со скриптами: https://docs.google.com/document/d/1IJpXrR504vWfqR4PsE3a7XtZlXdCfT83Y9WYvgXRGMM/edit?usp=sharing
Для удобства обозначим следующие бактерии цифрами
1 - Escherichia coli
2 - Candidatus Gracilibacteria bacterium
3 - Mycoplasma pneumoniae
Задание номер 1
1
ATG: 3890
ATT: 4
CTG: 2
GTG: 338
TTC: 1
TTG: 80
2
ACA: 1
ATG: 1129
GTG: 41
TCA: 1
TCT: 1
TTG: 23
3
AAA: 1
ACA: 1
ACT: 1
ATA: 3
ATC: 1
ATG: 627
ATT: 7
CAA: 1
CAC: 1
CTA: 1
CTC: 3
CTG: 2
GAA: 1
GTG: 60
GTT: 1
TCC: 2
TCT: 1
TGA: 1
TTA: 1
TTC: 1
TTG: 49
Недавно было показано, что при определенных условиях для инициации трансляции в Escherichia coli может использоваться множество различных стартовых кодонов, хотя большинство из них используются редко, тогда как ATG, за которым следуют GTG, а затем TTG, остаются основными стартовыми сигналами. В соответствии с этим рейтингом стартовых кодонов гены, начинающиеся с ATG, в среднем экспрессируются на значительно более высоких уровнях, чем гены, которые начинаются с GTG, и последние экспрессируются на более высоких уровнях, чем гены, начинающиеся с TTG. Все стартовые кодоны, по-видимому, распознаются специальным инициатором N-формил метионил-тРНК с антикодоном CAT. Распознавание стартовых кодонов и дискриминация между тРНК инициатора и удлинения зависят от фактора инициации трансляции IF3, который помогает позиционировать правильный стартовый кодон в рибосомном Р-сайте до связывания аминоацил-тРНК. У прокариот стартовый кодон является одним из основных детерминант инициации трансляции: замена ATG альтернативным стартовым кодоном, таким как GTG, обычно приводит к многократному падению эффективности трансляции. Сообщается о корреляции между типом стартового кодона и наличием последовательности Шайн-Далгарно (SD): гены с запуском ATG с большей вероятностью обладают последовательностью SD, чем гены с альтернативными запусками. Но на основа проводимых испытаний выявилось, что гены, начинающиеся с GTG и TTG, обычно показывают более сильное сохранение последовательности Шайн-Далгарно по сравнению с генами с началом ATG [1].
По представленным выше данным не трудно заметить, что на первом месте по встечаемости находиться ATG, на втором - GTG, на третьем - TTG. Все остальные страт-кодоны встречаются гораздо реже. Нельзя не обратить внимание на количество страт-кодонов у Mycoplasma pneumoniae такое разнообразие можно объяснить только тем, что они являются псевдогенами.
Задание номер 2
только для 1
lcl|U00096.3_cds_b4587_250 [gene=insN] [locus_tag=b4587] [db_xref=ASAP:ABE-0285253,ECOCYC:G6130] [protein=IS911A regulator fragment] [pseudo=true] [location=join(270278..270540,271764..272190)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13438.1_1459 [gene=fdnG] [locus_tag=b1474] [db_xref=UniProtKB/Swiss-Prot:P24183] [protein=formate dehydrogenase N subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13438.1] [location=1547401..1550448] [gbkey=CDS]
lcl|U00096.3_cds_AAD13456.1_3824 [gene=fdoG] [locus_tag=b3894] [db_xref=UniProtKB/Swiss-Prot:P32176] [protein=formate dehydrogenase O subunit alpha] [transl_except=(pos:586..588,aa:Sec)] [protein_id=AAD13456.1] [location=complement(4082772..4085822)] [gbkey=CDS]
lcl|U00096.3_cds_AAD13462.1_3997 [gene=fdhF] [locus_tag=b4079] [db_xref=UniProtKB/Swiss-Prot:P07658] [protein=formate dehydrogenase H] [transl_except=(pos:418..420,aa:Sec)] [protein_id=AAD13462.1] [location=complement(4297219..4299366)] [gbkey=CDS]
На основе описания можно понять, что первый ген является псевдогеном ( ген, который утратил свою функцию). Следовательно произошла мутация, из-за которой образовался стоп-кодон, но, как мы видим, это мутация не влияет на выживаемость.
Наиболее предпочтительным способом эффективного завершения трансляции для клетки было бы обладание неацилированными тРНК, антикодоны которых распознают три стоп-кодона TAA, TGA и TAG. Это, конечно, не так, но редко задают вопрос: почему бы и нет? По крайней мере, часть ответа заключается в том, что универсальный генетический код не совсем универсален; то есть стоп-кодоны не всегда кодируют «стоп». Например, TAA и TGA кодируют глютамин в некоторых реснитях (Preer et al., 1985), TGA кодирует цистеин в Euplotes octocarinatus (Meyer et al., 1991), а TGA кодирует триптофан в митохондриях (Macino et al., 1979) и селеноцистеин (Sec) в метазоанах, архебактериях и эубактерия[2].
В остальных 3 генах мы можем заметить, что в гене формиат дегидрогеназы TGA не является стоп-кодоном, а кодируется аминокислоту селеноцистеин.
Задание номер 3
1
TGA: 1246
TAA: 2761
TAG: 306
2
TGA: 1
TAA: 1000
TAG: 188
3
TGA: 0
TAA: 526
TAG: 220
Почему стоп-кодоны могут редко использовать? Скорее всего это связано с тем, что они выполняют другую функцию, если быть точнее, они кодируют каки-то аминокислоты.
у 2 и 3 бактерии TGA кодирует глицин и триптофан, именно поэтому они либо очень редко встречаются к конце, либо вообще не встречаются [2].
Задание номер 4
1
TTA 18505
TTG 18301
CTA 5203
CTC 14952
CTG 71305
CTT 14728
2
TTA 15077
TTG 8048
CTA 4861
CTC 4491
CTG 4147
CTT 8053
3
TTA 9246
TTG 6554
CTA 3505
CTC 2193
CTG 3054
CTT 4623
У одной и той же бактерии кодоны кодирующие лейцин встречаются с разной частотой, следовательно, в разных бактериях их частота будет отличаться. Это связано с распространенностью тРНК, взаимодействующих с кодонами, что может влиять на конформацию белка, т.е. происходит нехватка тРНК для, находящегося в конце участка белка, поэтому участок не успевает принять нужную конформацию.
Задание номер 5
только для 1
ссылка на расчеты и график: https://docs.google.com/spreadsheets/d/11NEoTzf37wkiaesAlNuD-1X7ApyRP6ZGOPRXXXcAzzY/edit?usp=sharing
Максимальное значение соответствует ориджину, а минимальное - концу репликации [3].
Задание номер 6
для 1
AAGGAG 183
TAAGGA 163
AGGAGA 129
AAGGAA 122
AAAGGA 120
CAGGAG 120
AGGAGT 113
GGAGAA 104
AGGAAA 101
ACAGGA 94
AAAAGG 87
для 2
AAATAA 115
AAAAAA 113
TAAAAA 111
TTTTTT 110
ATAAAA 107
AATAAA 104
ATTTTT 102
AAAAAT 97
TAATAA 93
AATAAT 89
для 3
AATTAA 44
TTTAAA 40
ATTAAA 37
TTAAAA 35
AAAGGA 33
ATTTAA 32
TAAAAA 29
AATTTA 28
AAGAAA 28
AAAAAG 27
Последовательности представленные выше скорее всего являются последовательностью Шайна-Дальгарно (их еще обозначают SD, они влияют на экспрессию генов и могут компенсировать мутации в старт-кодонах. SD обычно располагаются на расстоянии в 10 нуклеотидов от старт-кодона - это является местом посадки рибосом на мРНК.
Литература:
[1] Belinky, F., Rogozin, I.B. & Koonin, E.V. Selection on start codons in prokaryotes and potential compensatory nucleotides substitutions. Sci Rep 7, 12422 (2017). https://doi.org/10.1038/s41598-017-12619-6
[2]Copeland, P.R. Regulation of gene expression by stop codon recoding: selenocysteine. Gene Volume 312, Pages 17-25 (2003). https://doi.org/10.1016/S0378-1119(03)00588-2
[3]Jennifer, L., Steven, L.S. SkewIT: The Skew Index Test for large-scale GC Skew analysis of bacterial genomes. PLoS Comput Biol 16(12): e1008439 (2020). https://doi.org/10.1371/journal.pcbi.1008439 https://doi.org/10.1371/journal.pcbi.1008439