Предсказание вторичной структуры заданной тРНК и анализ НК-белкового комплекса¶

Задание 1. Предсказание вторичной структуры заданной тРНК¶

  • Упр.1. Предсказание вторичной структуры тРНК путем поиска инвертированных повторов Программа einverted из пакета EMBOSS позволяет найти инвертированные участки в нуклеотидных последовательностях. Найдите возможные комплементарные участки в последовательности исследуемой тРНК. Сравните с их описанием, полученным ранее с помощью find_pair. Результаты сравнения занесите в таблицу, приведенную ниже. Постарайтесь подобрать параметры для получения предсказания, наиболее близкого к реальной структуре.

Пример запуска einverted, значения переменных среды остануться¶

In [1]:
%set_env PATH=/home/preps/golovin/miniconda3/bin:/home/preps/golovin/miniconda3/condabin:/usr/local/bin:/usr/bin:/home/preps/golovin/progs/x3dna-v2.4/bin
env: PATH=/home/preps/golovin/miniconda3/bin:/home/preps/golovin/miniconda3/condabin:/usr/local/bin:/usr/bin:/home/preps/golovin/progs/x3dna-v2.4/bin
In [54]:
! echo "UGGGGUAUCGCCAAGCGGUAAGGCACCGGAUUCUGAUUCCGGCAUUCCGAGGUUCGAAUCCUCGUACCCCAGCCA" > rna.seq 
! einverted -sequence rna.seq -gap 12 -threshold 20 -match 4 -mismatch -5 -outfile outfile_acceptor -outseq seqout_acceptor
Find inverted repeats in nucleotide sequences

В результате первого запуска команды без ограничения расстояния между инвертированными повторами был найден акцепторный стебель: 1-7 и 65-71

In [55]:
! einverted -sequence rna.seq -gap 12 -threshold 20 -match 4 -mismatch -5 -maxrepeat 30 -outfile outfile_Tanti -outseq seqout_Tanti
Find inverted repeats in nucleotide sequences

Но когда мы ограничили расстояние между инвертированными повторами мы смогли ещё найти примерные координаты антикодонового и T стебеля:

  • Антикодоновый: 26-33 и 35-42
  • Т стебель: 48-52 и 60-64

D-стебель имеет слишком короткий инвертированный повтор для того, чтобы его можно было найти этой программой, по моему мнению.

ViennaRNA¶

  • Упр.2. Предсказание вторичной структуры тРНК по алгоритму Зукера с помощью ViennaRNA.
In [67]:
# предскажем несколько  кандидатных структур 
import RNA 
seq = "UGGGGUAUCGCCAAGCGGUAAGGCACCGGAUUCUGAUUCCGGCAUUCCGAGGUUCGAAUCCUCGUACCCCAGCCA"
 
# create fold_compound data structure (required for all subsequently applied  algorithms)
fc = RNA.fold_compound(seq)
 
# compute MFE and MFE structure
(mfe_struct, mfe) = fc.mfe()
 
# rescale Boltzmann factors for partition function computation
fc.exp_params_rescale(mfe)
 
# compute partition function
(pp, pf) = fc.pf()

# compute MEA structure
(MEA_struct, MEA) = fc.MEA()
 
# compute free energy of MEA structure
MEA_en = fc.eval_structure(MEA_struct)
 
# print everything like RNAfold -p --MEA
print("%s\n%s (%6.2f)" % (seq, mfe_struct, mfe))
print("%s [%6.2f]" % (pp, pf))
print("%s {%6.2f MEA=%.2f}" % (MEA_struct, MEA_en, MEA))
print(" frequency of mfe structure in ensemble %g; ensemble diversity %-6.2f" % (fc.pr_structure(mfe_struct), fc.mean_bp_distance()))
UGGGGUAUCGCCAAGCGGUAAGGCACCGGAUUCUGAUUCCGGCAUUCCGAGGUUCGAAUCCUCGUACCCCAGCCA
(((((((..(((.........))).(((((.......))))).....(((((.......)))))))))))).... (-28.00)
((((((({,(({..,,,,...}}}.(((((.......))))).....|((((.......)))))))))))).... [-29.15]
(((((((..(((.........))).(((((.......))))).....(((((.......)))))))))))).... {-28.00 MEA=60.56}
 frequency of mfe structure in ensemble 0.155127; ensemble diversity 14.36 

Можно найти набор субоптимальных структур для оценки потенциального разнообразия¶

In [66]:
RNA.svg_rna_plot(seq, MEA_struct, ssfile='ggg.svg' )
from IPython.display import SVG
SVG('ggg.svg')
Out[66]:
No description has been provided for this image

Судя по построенной структуре координаты стеблей следующие: Акцепторный стебель: 1-7 и 65-71 D стебель: 10-12 и 22-24 T стебель: 26-30 и 38-42 Антикодоновый стебель: 48-52 и 60-64

Реальная и предсказанная вторичная структура тРНК из файла XXXX.pdb¶

Участок структуры (расшифровку названий см. http://kodomo.fbb.msu.ru/FBB/year_07/term3/tRNA.pdf на рис. 2 в статье О.О.Фаворовой) Позиции в структуре (по результатам find_pair ) Результаты предсказания с помощью einverted Результаты предсказания по алгоритму Зукера
Акцепторный стебель 2-7 и 66-71 1-7 1-7
D-стебель 10-12 и 23-25 — 10-12 и 22-24
T-стебель 26-33 и 37-44 26-33 и 35-42 26-30 и 38-42
Антикодоновый стебель 49-63 и 61-65 48-52 и 60-64 48-52 и 60-64
Общее число канонических пар нуклеотидов 22 20 20