Предсказание вторичной структуры заданной тРНК и анализ НК-белкового комплекса¶
Задание 1. Предсказание вторичной структуры заданной тРНК¶
- Упр.1. Предсказание вторичной структуры тРНК путем поиска инвертированных повторов Программа einverted из пакета EMBOSS позволяет найти инвертированные участки в нуклеотидных последовательностях. Найдите возможные комплементарные участки в последовательности исследуемой тРНК. Сравните с их описанием, полученным ранее с помощью find_pair. Результаты сравнения занесите в таблицу, приведенную ниже. Постарайтесь подобрать параметры для получения предсказания, наиболее близкого к реальной структуре.
Пример запуска einverted, значения переменных среды остануться¶
In [1]:
%set_env PATH=/home/preps/golovin/miniconda3/bin:/home/preps/golovin/miniconda3/condabin:/usr/local/bin:/usr/bin:/home/preps/golovin/progs/x3dna-v2.4/bin
env: PATH=/home/preps/golovin/miniconda3/bin:/home/preps/golovin/miniconda3/condabin:/usr/local/bin:/usr/bin:/home/preps/golovin/progs/x3dna-v2.4/bin
In [54]:
! echo "UGGGGUAUCGCCAAGCGGUAAGGCACCGGAUUCUGAUUCCGGCAUUCCGAGGUUCGAAUCCUCGUACCCCAGCCA" > rna.seq
! einverted -sequence rna.seq -gap 12 -threshold 20 -match 4 -mismatch -5 -outfile outfile_acceptor -outseq seqout_acceptor
Find inverted repeats in nucleotide sequences
В результате первого запуска команды без ограничения расстояния между инвертированными повторами был найден акцепторный стебель: 1-7 и 65-71
In [55]:
! einverted -sequence rna.seq -gap 12 -threshold 20 -match 4 -mismatch -5 -maxrepeat 30 -outfile outfile_Tanti -outseq seqout_Tanti
Find inverted repeats in nucleotide sequences
Но когда мы ограничили расстояние между инвертированными повторами мы смогли ещё найти примерные координаты антикодонового и T стебеля:
- Антикодоновый: 26-33 и 35-42
- Т стебель: 48-52 и 60-64
D-стебель имеет слишком короткий инвертированный повтор для того, чтобы его можно было найти этой программой, по моему мнению.
ViennaRNA¶
- Упр.2. Предсказание вторичной структуры тРНК по алгоритму Зукера с помощью ViennaRNA.
In [67]:
# предскажем несколько кандидатных структур
import RNA
seq = "UGGGGUAUCGCCAAGCGGUAAGGCACCGGAUUCUGAUUCCGGCAUUCCGAGGUUCGAAUCCUCGUACCCCAGCCA"
# create fold_compound data structure (required for all subsequently applied algorithms)
fc = RNA.fold_compound(seq)
# compute MFE and MFE structure
(mfe_struct, mfe) = fc.mfe()
# rescale Boltzmann factors for partition function computation
fc.exp_params_rescale(mfe)
# compute partition function
(pp, pf) = fc.pf()
# compute MEA structure
(MEA_struct, MEA) = fc.MEA()
# compute free energy of MEA structure
MEA_en = fc.eval_structure(MEA_struct)
# print everything like RNAfold -p --MEA
print("%s\n%s (%6.2f)" % (seq, mfe_struct, mfe))
print("%s [%6.2f]" % (pp, pf))
print("%s {%6.2f MEA=%.2f}" % (MEA_struct, MEA_en, MEA))
print(" frequency of mfe structure in ensemble %g; ensemble diversity %-6.2f" % (fc.pr_structure(mfe_struct), fc.mean_bp_distance()))
UGGGGUAUCGCCAAGCGGUAAGGCACCGGAUUCUGAUUCCGGCAUUCCGAGGUUCGAAUCCUCGUACCCCAGCCA
(((((((..(((.........))).(((((.......))))).....(((((.......)))))))))))).... (-28.00)
((((((({,(({..,,,,...}}}.(((((.......))))).....|((((.......)))))))))))).... [-29.15]
(((((((..(((.........))).(((((.......))))).....(((((.......)))))))))))).... {-28.00 MEA=60.56}
frequency of mfe structure in ensemble 0.155127; ensemble diversity 14.36
Можно найти набор субоптимальных структур для оценки потенциального разнообразия¶
In [66]:
RNA.svg_rna_plot(seq, MEA_struct, ssfile='ggg.svg' )
from IPython.display import SVG
SVG('ggg.svg')
Out[66]:
Судя по построенной структуре координаты стеблей следующие: Акцепторный стебель: 1-7 и 65-71 D стебель: 10-12 и 22-24 T стебель: 26-30 и 38-42 Антикодоновый стебель: 48-52 и 60-64
Реальная и предсказанная вторичная структура тРНК из файла XXXX.pdb¶
| Участок структуры (расшифровку названий см. http://kodomo.fbb.msu.ru/FBB/year_07/term3/tRNA.pdf на рис. 2 в статье О.О.Фаворовой) | Позиции в структуре (по результатам find_pair ) | Результаты предсказания с помощью einverted | Результаты предсказания по алгоритму Зукера |
|---|---|---|---|
| Акцепторный стебель | 2-7 и 66-71 | 1-7 | 1-7 |
| D-стебель | 10-12 и 23-25 | — | 10-12 и 22-24 |
| T-стебель | 26-33 и 37-44 | 26-33 и 35-42 | 26-30 и 38-42 |
| Антикодоновый стебель | 49-63 и 61-65 | 48-52 и 60-64 | 48-52 и 60-64 |
| Общее число канонических пар нуклеотидов | 22 | 20 | 20 |