Предсказание вторичной структуры заданной тРНК

В первом задании необходимо было предсказать вторичную структуру тРНК с помощью различных программ.

На следующем рисунке представлена структура тРНК, а также названия, принятые для ее участков.

При выполнении заданий использовались программы: einverted и RNAfold.

Программа einverted из пакета EMBOSS позволяет найти инвертированные участки в нуклеотидных последовательностях. Einverted получает на вход нуклеотидную последовательность и выдает файлы, содержащие информацию об обнаруженных комплементарных участках последовательности и предполагаемых водородных связях на этих участках.

команда: einverted 2dxi.fasta

Так как запуск программы с парамерами по умолчанию оказался неудачным. Пришлось подбирать оптимальные параметры. Параметры, при которых результаты наиболее точно отражали реальность:

Gap penalty [12]: 9

Minimum score threshold [50]: 20

Match score [3]: 4

Mismatch score [-4]: -5

Программа einverted обнаружила только 4 пары (неверные), хотя и наиболее близкие к реальности, к тому же все найденные связи были сдвинуты на один нуклеотид. Помимо этого, программа также неспособна обнаруживать неканонические взаимодействия, что заведомо уменьшает точность результата. Поэтому можно сказать, что find_pair лучше справляется с этой задачей.

Еще одна программа для предсказания вторичной структуры тРНК RNAfold из пакета Viena Rna Package реализует алгоритм Зукера. Она принимает на вход последовательность РНК и рассчитывает ее вторичную структуру с минимальной свободной энергией.

команда: cat 2dxi.fasta | RNAfold --MEA >> rna_fold.fasta

Т.к. несмотря на то, что был указан путь к ней:

export PATH=${RNAfold}:/home/preps/golovin/progs/bin

программа не работала, поэтому был использован web вариант:

http://rna.tbi.univie.ac.at//cgi-bin/RNAWebSuite/RNAfold.cgi.

Вывод содержит последовательность в записи формата dot-bracket, в которой "(" и ")" соответствуют 5'- и 3'-основаниям соответственно. Первая строчка - последовательность РНК, а последующая - предсказанная структура. Точки - нуклеотиды, не образующие водородные связи, круглые скобки - нуклеотиды, образующие пары.

Помимо текстовой записи мы получаем ещё и графическое изображение предсказанной вторичной структуры, которое может быть дополнительно раскрашено по вероятностям образования пар, а также точечный график c этими вероятностями.

Сравнение результатов с выдачей программ find_pair, einverted и RNAfold (алгоритм Зукера) представлены в таблице

Участок структуры

Позиции по результатам find_pair

Результаты предсказания с помощью einverted

Результаты предсказания по алгоритму Зукера

Акцепторный стебель

5' ----------------> 3'

5' ----------------> 3'

5' ----------------> 3'

C:501[G]---[C]572:C

C:503[C]---[G]569:C

C:501[G]---[C]572:C

C:502[G]---[U]571:C

C:504[C]---[G]568:C

C:502[G]---[U]571:C

C:503[C]---[G]570:C

C:505[C]---[G]567:C

C:503[C]---[G]570:C

C:504[C]---[G]569:C

C:506[C]---[G]566:C

C:504[C]---[G]569:C

C:505[C]---[G]568:C

C:507[A]---[U]565:C

C:505[C]---[G]568:C

C:506[C]---[G]567:C

C:506[C]---[G]567:C

C:507[A]---[U]566:C

Всего 0 верных пар

C:507[A]---[U]566:C

Всего 7 пар

Всего 7 пар

D-стебель

C:510[G]---[C]525:C

Всего 0 пар

C:510[G]---[C]525:C

C:511[U]---[A]524:C

C:511[U]---[A]524:C

C:512[C]---[G]523:C

C:512[C]---[G]523:C

C:513[U]---[G]522:C

C:513[U]---[G]522:C

Всего 4 верных пары

C:509[C]---[G]526:C

Всего 4 пары

+1 лишняя пара

T-стебель

C:549[G]---[C]565:C

Всего 0 пар

C:549[G]---[C]565:C

C:550[G]---[C]564:C

C:550[G]---[C]564:C

C:551[G]---[C]563:C

C:551[G]---[C]563:C

C:552[G]---[C]562:C

C:552[G]---[C]562:C

C:553[G]---[C]561:C

C:553[G]---[C]561:C

Всего 5 пар

Всего 5 пар

Антикодоновый стебель

C:538[A]---[C]532:C

Всего 0 пар

C:539[G]---[C]531:C

C:539[G]---[C]531:C

C:540[G]---[C]530:C

C:540[G]---[C]530:C

C:541[C]---[G]529:C

C:541[C]---[G]529:C

C:542[C]---[G]528:C

C:542[C]---[G]528:C

C:543[G]---[C]527:C

C:543[G]---[C]527:C Всего 7 пар

Общее число верно найденных пар нуклеотидов

23 пары

0 пар

21 пара

По результатам, представленным в таблице, можно сделать вывод, что основной проблемой обоих подходов было затруднение в учёте неканонических взаимодействий. В общем, хочется сказать, что из всех программ лучше всего находит водородные связи между нуклеотидами find_pair, а хуже всех — einverted. Einverted не построил ни одного из четырёх неканонических взаимодействий Программа RNAfold тоже довольно хорошо справляется с поставленной задачей: были учтены две G-U пары, однако результаты ее работы все-таки необходимо проверять. Плюсом можно назвать возможность визуализации примерной структуры тРНК в плоскости, что, конечно, помогает ее анализировать.

К семестрам


© Енькова Анна, 2017