Учебная страница курса биоинформатики,
год поступления 2019
Идеальны мотив разрывной транскрипции в геномах коронавирусов
Извините, не написал вовремя. Виноват (ААл).
Нет мне оправдания, но для смягчения вины укажу, что в презентации Л1 сигналы TRS разбирались. Ну и год такой))) Не хватает внимания на все многочисленные мои обязательства. Поэтому заранее благодарен за напоминания!
Ну вот, давайте рассуждать. Комплекс белков РНК-зависимая РНК-полимераза (RdRP) и какого-то вирусного белка (подозревают белок N) садится на 3' конец РНК коронавируса (+РНК).
Белок (для определенности, N, хотя строгих доказательств в лит-ре не встречал) держит лидерную часть РНК так, что сигнал TRS-L сближен с РНК-матрицей, по которой едет комплекс и RdRP синтезирует комплементарную РНК (-РНК).
При встрече в РНК-матрице последовательности, совпадающей с TRS-L или очень похожей на неё, RdRP с растущим 3'-концом -РНК отваливается от матрицы +РНК и с какой-то вероятностью либо приваливается обратно к матрице +РНК либо приваливается к лидерной части +РНК, которая тут же рядом. Приваливается к лидеру потому, что 3' конец растущей -РНК в этом месте комплементарен последовательности, похожей на TRS-L. Значит, он комплементарен самой TRS-L и почему бы к ней не привалиться по комплементарности. И в таком случае RdRP продолжит синтез -РНК по матрице, которой станет служить лидерная последовательность, начиная с TRS-L.
Лучше посмотрите на слайде 23 из презентации Л1. Выше пересказал своим словами этот слайд.
При перескоке в месте сигнала TRS-B, расположенном перед поздним геном получаем -мРНК позднего гена. Комплементарная копия её будет мРНК позднего гена со всеми сигналами мРНК.
В мРНК каждого позднего гена в идеале до ATG кодона гена не должно быть других ATG кодонов в любой из трех рамок (более точно - надо учитывать сходство с последовательностью Козак для хозяина; мы на это забьём).
В идеале в лидерной последовательности - до первого ATG кодона - должен быть один сигнал TRS-L и перед каждым поздним геном должен быть сигнал TRS-B, высоко сходный с TRS-L. Итого идеально: 1 + n (где n - число поздних генов) сигналов TRS описываются одним мотивом, найденным MEME.
По литературным данным, в идеале наиболее консервативная часть сигналов TRS состоит из 6 нукл. и называется CS (core sequence). Часто CS совпадают буквально, но не всегда.
По здравому смыслу, других сигналов с тем же мотивом в области поздних генов - после гена ORF1ab, кроме (1+n) указанных выше, быть не должно. Иначе разрывная транскрипция будет происходить и в "неправильных" местах, это не только не нужно, но и вредно, т.к. на сканирование "неправильной" мРНК будут уходить ресурсы хозяйской клетки - вместо того, чтобы работать на синтез белков коронавируса.
ИДЕАЛ в биологии редко встречается. Поэтому не расстраивайтесь если мотивы, выданные MEME, не соответствуют идеалу. Но чем больше соответствуют, тем лучше.