Практикум 14
🦠 Задание 1
Ниже перечислены варианты старт-кодонов, которые используют бактерии:
Bacillus subtilis
AAG 1(pseudogene)
AAT 2 (pseudogenes)
ACA 1 (pseudogene)
ACG 1 (pseudogene)
AGA 1 (pseudogene)
AGC 1 (pseudogene)
AGG 1 (pseudogene)
ATC 5 (2 pseudogenes)
ATG 3332
ATT 13
CAA 2 (pseudogenes)
CGG 1 (pseudogene)
CTA 2 (pseudogenes)
CTG 6 (1 pseudogene)
GAA 1 (pseudogene)
GAT 2 (pseudogenes)
GGT 1 (pseudogene)
GTA 1 (pseudogene)
GTG 395
TAT 1 (pseudogene)
TTA 1 (pseudogene)
TTG 564
TTT 2 (pseudogenes)
Peptoclostridium acidaminophilum
AAG 1 (pseudogene)
AGC 1 (pseudogene)
ATA 9
ATC 5
ATG 1682
ATT 9
CTA 2 (pseudogenes)
CTG 1
GAA 1 (pseudogene)
GGT 1 (pseudogene)
GTG 180
TAC 1 (pseudogene)
TTA 2 (pseudogenes)
TTG 249
Ureaplasma urealyticum parvum
ATA 2
ATC 1
ATG 561
ATT 2
CTT 1 (pseudogene)
GTG 22
TAT 1 (pseudogene)
TTA 2
TTG 24
Возможные причины использования старт-кодонов, отличных от ATG:
1) В геномах бактерий в качестве старт-кодонов часто встречаются кодоны TTG или GTG. Таким образом, первый нуклеотид А в старт-кодоне заменился на T или G. Вероятно, это произошло вследствие точечных мутаций, которые затем закрепились в поколениях, так как данные мутантные старт-кодоны были удобными для кодирования белков (инициации трансляции)
2) Часть старт-кодонов ATG утрачивается в процессе эволюции (при различных факторах), что приводит к свигу рамки считывания, а следственно и к изменению старт-кодона
3) Малая субъединица рибосомы способна прикреплиться к мРНК раньше положения старт-кодона, что способно привести к изменению старт-кодона
4) Из-за мутаций сдвига рамки считывания (такие мутации вызаны делециями или вставками рядов нуклеотидов в последовательности ДНК) происходит изменение рамки считывания, что приводит к изменению старт-кодонов
5) Некоторые гены могут специально изменить старт-кодон на нетипичный для осуществления уникальных биологических функций, что может потребовать особую экспрессию и регуляцию генов
6) Возможны мутации в структурах рРНК, из-за чего молекулы рРНК начинают принимать за старт-кодоны другие кодоны, а не ATG (часто изменения происходят в структуре РНК-полимеразы)
*код, используемый в задании: start codons
🦠 Задание 2
Кодирующие последовательности Peptoclostridium acidaminophilum, в которых содержится стоп-кодон не в конце последовательности. Таких последовательностей нашлось 23:
1) gene: grdH, protein: betainereductaseselenoproteinB
2) gene: fdhF, protein: formatedehydrogenasesubunitalpha
3) gene: htpG, protein: molecularchaperoneHtpG, pseudogene
4) protein: pyridoxamine5'-phosphateoxidasefamilyprotein, pseudogene
5) gene: grdA, protein: glycine/sarcosine/betainereductasecomplexselenoproteinA
6) gene: grdB, protein: glycinereductasecomplexselenoproteinB
7) gene: glgA, protein: glycogensynthaseGlgA, pseudogene
8) protein: IS3familytransposase, pseudogene
9) protein: ABCtransportersubstrate-bindingprotein, pseudogene
10) gene: selD, protein: selenide,waterdikinaseSelD
11) gene: rpsP, protein: 30SribosomalproteinS16, pseudogene
12) protein: HollidayjunctionresolvaseRuvX, pseudogene
13) protein: 1-deoxy-D-xylulose-5-phosphatereductoisomerase, pseudogene
14) protein: IS607familytransposase, pseudogene
15) protein: iron-sulfurclusterbiosynthesisfamilyprotein
16) gene: grdA, protein: glycine/sarcosine/betainereductasecomplexselenoproteinA
17) gene: grdB, protein: glycinereductasecomplexselenoproteinB
18) gene: grdA, protein: glycine/sarcosine/betainereductasecomplexselenoproteinA
19) gene: saoL, protein: MerB-likeorganometalliclyaseSaoL
20) gene: saoP, protein: ABCtransporterpermeasesubunitSaoP
21) gene: fdhF, protein: formatedehydrogenasesubunitalpha
22) gene: saoB, protein: ABCtransportersubstrate-binding(seleno)proteinSaoB
23) gene: saoT, protein: thioredoxin-like(seleno)proteinSaoT
В последовательностях под номерами 3, 4, 7, 8, 9, 11, 12, 13, 14 белки не кодируются (то есть это псевдогены), следовательно стоп-кодон не находится на последнем месте, так как рамка считывания сбита. Также есть вероятность, что данные фрагменты являются частью других более длинных последовательностей
Гены grdA под номерами 5, 16, 18 кодируют селенопротеин А глицинредуктазного комплекса. Стоп-кодон TGA, соответствующий расположению единственного остатка селеноцистеина в полипептиде, был обнаружен в рамке считывания в положении 130. Скорее всего, вторичные структуры мРНК с grdA не являются функциональными для UGA-направленной вставки селеноцистеина в систему экспрессии
Гены grdB под номерами 6 и 17 кодируют субъединицу субстратно-специфичного селенопротеина PB глицина. Известно, что в 3'-нетранслируемой области grdB идентифицирована вторичная структура, что и стало причиной наличия стоп-кодона (необходим для образования вторичной структуры и не влияет на транскрипцию)
Ген grdH под номером 1 очень малораспространённый в геномах живых организмов, он образовался вследствие генной мутации. Возможно именно эта мутация и привела к появлению стоп-кодона в середине последовательности
Если говорить о генах fdhF под номерами 2 и 21. В них можно найти кодон TGA, который является не только стоп-кодоном, но и кодировщиком селеноцистеина, помогает ему встраиваться в пептид
Ген selD под номером 10 также имеет кодон TGA, который кодирует селеноцистеин (похож на fdhF)
Ген под номером 15 кодирует компонент каркаса железо-серных кластеров. Это один из наиболее древних генов, присутствующих в геноме живых организмов. Альтернативный сплайсинг приводит к появлению вариантов транскрипта, кодирующих различные изоформы белка. Из-за этого в гене возможны мутации. Так, мутация в интроне может активировать сайт сплайсинга, что приводит к образованию варианта сплайсинга, кодирующего предположительно нефункциональный белок (то есть ген становится псевдогеном)
Про группу генов sao_ недостаточно информации, чтобы сделать какой-нибудь вывод или предположение
*код, используемый в задании: Peptoclostridium
🦠 Задание 3
Ниже представлены частоты стопкодонов в геномах бактерий:
Bacillus subtilis
TAA 2723
- TAG 619 TGA 983
Peptoclostridium acidaminophilum
TAA 1091
- TAG 762 TGA 284
Ureaplasma urealyticum parvum
TAA 529
- TAG 87 TGA 0
у Ureaplasma urealyticum parvum в числе стоп-кодонов отсутствует кодон TGA - именно его и можно считать пропавшим стоп-кодонам. Но при этом в генной последовательности (не в конце) кодон TGA встречается довольно часто, из чего можно сделать вывод, что он кодирует определённую аминокислоту. И действительно, кодон TGA в геноме Ureaplasma urealyticum parvum кодирует триптофан, что подтверждается научными статьями [1] [2]
*код, используемый в задании: stop codons
🦠 Задание 4
Ниже представлены гены, содержащие в описании координат join:
Bacillus subtilis
gene: prfB, protein: peptidechainreleasefactor2, location: complement(join(3645147..3646175,3646177..3646248))
Peptoclostridium acidaminophilum
protein: IS3familytransposase, location: join(589839..590088,590088..590950)
protein: IS3familytransposase, location: join(736848..737097,737097..737959)
protein: IS3familytransposase, location: complement(join(1093662..1094533,1094533..1094806))
protein: IS3familytransposase, location: complement(join(1097590..1098461,1098461..1098734))
gene: prfB, protein: peptidechainreleasefactor2, location: complement(join(1783761..1784795,1784797..1784871))
1) При описании координат гена "join" указывает на соединение или объединение различных частей генома (например, когда участки ДНК расположены непоследовательно, но при этом объединяются для формирование целостного участка мРНК)
2) У бактерий отсутствует сплайсинг в том понимании, что он есть у эукариот. Обычно бактериальная мРНК не содержит интронов, что связано с прямыми транслитами
3.1) Некоторые части гена prfB являются супрессорами, подавляющими экспрессию мутантных частей гена (образующихся в процессе эволюции), что позволяет ускорить синтез исходного белка и уменьшить количество мутантного белка, выполняющего свои исходный функции неполно или с недостаточной эффективностью
3.2) При рассмотрении генов, кодирующих транспозазы, выявляется, что отдельные последовательности гена кодируют белки OrfA и OrfB. Перекрывание же данных участков гена и их совместная трансляция приводит к синтезу транспозазы OrfAB
*код, используемый в задании: join
📟 Сопроводительные материалы
📗 Литература
[1] Guozhi Dai, Ranhui Li, Hongliang Chen, Chuanhao Jiang, Xiaoxing You & Yimou Wu. A ferritin-like protein with antioxidant activity in Ureaplasma urealyticum. BMC Microbiol 15, 145 (2015), line 99-100
[2] T D Fox. Five TGA "stop" codons occur within the translated sequence of the yeast mitochondrial gene for cytochrome c oxidase subunit II. Proc Natl Acad Sci U S A. 1979 Dec;76(12):6534-8