В этом практикуме исследовались G-квадруплексы, расположенные в промоторах генов и регулирующие транскрипцию.
G-квадруплексы - это форма вторичной структуры ДНК, образующаяся за счет водородных связей между четырьмя участками цепи ДНК (рис. 1).
Рис.1. Структура G-квадруплекса в промоторе гена c-MYC. По: Yang, Hurley, 2006.
G-квадруплексы встречаются в промоторах многих генов, связанных с онкологическими заболеваниями: с-Myc, c-kit, VEGF, Bcl-2, Rb, RET (Guo et al., 2007).
Традиционно считается, что основная роль этих структур - подавление экспрессии генов, так как они тормозят продвижение факторов транскрипции по гену (рис. 2).
Рис.2. Репрессия транскрипции гена c-MYC G-квадруплексом. По: Yang, Hurley, 2006.
Однако, как показано в обзорной статье Robinson et al 2021 года, эта гипотеза может не вполне отражать реальность: во многих случаях экспрессия гена, промотор которого содержит G-квадруплексы, повышается. Это может объясняться несколькими механизмами регуляции: во-первых, квадруплексы участвуют в формировании топологически ассоциированных доменов (участков ДНК, удаленных друг от друга в цепи, но сближенных пространственно) (рис. 3). Таким образом белки, связывающиеся с энхансером, оказываются также связаны с промотором, и тем самым получают возможность стимулировать транскрипцию.
Рис.3. Формирование топологически ассоциированных доменов. По: Robinson et al., 2021.
Во-вторых, связываясь с факторами транскрипции, квадруплексы могут обеспечивать разделение фаз: ДНК сворачивается так, что РНК-полимераза может связаться с промотором, не покидая свою фазу (рис.4).
Рис.4. Изменение конформации ДНК, приводящее к разделению фаз. По: Robinson et al., 2021.
Кроме того, в некоторых случаях (например, в генах VEGF и NTHL1) квадруплексы, если в них происходит окисление гуанина, перестраиваются, связываются поврежденным участком с белком APE1, участвующем в BER, после чего этот белок не удаляет окисленный гуанин, а вместо этого запускает транскрипцию гена, в результате экспрессия увеличивается в 4 раза (рис. 5).
Рис.5. Запуск транскрипции вследствие окисления гуанина. По: Robinson et al., 2021.
Для поиска G-квадруплексов в гене можно использовать сервис QGRS Mapper. Я запускал его с на сайте Ramapo Bioinformatics. Этот сервис находит в заданной нуклеотидной последовательности участки QGRS - Quadruplex forming G-Rich Sequences. Его преимущество перед другими сервисами состоит в том, что он может обрабатывать данные из базы данных GenBank, что позволяет пользователю вводить не саму последовательность, а только ее идентификатор. Кроме того, QGRS Mapper визуализирует деление РНК, соответствующей данному гену, на интроны и экзоны, так что становится понятно положение квадруплексов не только в ДНК, но и в транскрибируемых с нее РНК после процессинга.
Для иллюстрации работы данного сервиса я проанализировал в нем человеческий ген c-MYC (Gene ID: 4609). QGRS Mapper выдал следующие результаты: таблицу с информацией о строении гена (количество продуктов, поли-А сигналы, QGRS); его Gene Ontology; схему обоих продуктов, разделенных на интроны и экзоны, с информацией о количестве QGRS в каждом.
Рис.6. Выдача QGRS Mapper: последовательность ДНК с выделением участков, соответствующих экзонам, а также предположительных участков квадруплексов.
Guo,K., Pourpak,A., Beetz-Rogers,K., Gokhale,V., Sun,D., Hurley,L.H. (2007). Formation of Pseudosymmetrical G-Quadruplex and i-Motif Structures in the Proximal Promoter Region of the RET Oncogene. Journal of the Americal Chemical Society, 129, 10220-10228.
Robinson,J., Raguseo,F., Nuccio,S.P., Liano,D., Di Antonio,M. (2021). DNA G-quadruplex structures: more than simple roadblocks to transcription? Nucleic Acids Research, 49(15), 8419–8431.
Yang,D., Hurley,L.H. (2006). Structure of the Biologically Relevant G-Quadruplex in The c-MYC Promoter. Nucleosides, Nucleotides and Nucleic Acids, 25(8), 951-968.