В процессе ро-независимой терминации транксрипции у прокариот ключевую роль играет шпилька, образующаяся из ГЦ-богатого на конце мРНК, за которой слудует длинный участок из урацилов. Белок NusA, движущийся вместе с РНК-полимеразой, прочной связывается с образующийся шпилькой, что вызывает остановку полимеразы и её диссоциацию с ДНК-матрицы. Носителем сигнала является молекула РНК, адресат сигнала - белок NusA. Данный сигнал практически всегда вызывает терминацию транскрипции, поэтому является сильным.
Источники:
Для предсказания участков ро-независимой терминации существует веб-сервис ARNold (ссылка). Определение сигнала идет с помощью двух программ: Ervin и RNAmotif. Первой программе в качестве обучающего набора было дано выравнивание 1200 известных терминаторных последовательностей, на основе которого была построена PWM и осуществялется сравнение поданной последовательности с выравниванием. Вторая программа предсказывает участок ро-независимой терминации транксрипции на основе оценки стабильности образуюшейся шпильки и длины урацилового хвоста. На выходе программа выдает список находок с указанием: начала находки, программы нашедшей её, прямой или обратной цепи, самой поселдовательности шпильки, свободной энергии шпильки (ккал/моль).
Запустить программу было решено на плазмиде E. coli (ENA AP026102.1). Выдачу программы можно посмотреть ссылка. Если сравнить находки с координатами генов в FT, то можно заметить, что многие находки попадают в конец CDS, что может говорить о ро-независимой терминации мРНК этих генов. К сожалению, проверить программу на каком-то наборе данных с известными механизмами терминации у меня не вышло, так как крайне затруднительно найти подходящий датасет, где были бы указаны механизмы терминации.