Предсказание вторичной структуры тРНК из файла 1GTR.pdbРабота производилась с файлом 1GTR_rna.fasta, содержащим последовательность заданной тРНК (цепь В белка 1GTR). Файл был скачан из сайта PDB. Предсказание вторичной структуры тРНК путём поиска инвертированных повторов Для предсказания вторичной структуры тРНК была использована программа einverted из пакета EMBOSS (ищет инвертированные повторы). Известно, что программа не работает с нестандартными нуклеотидами, но таких в моей последовательности нет, поэтому никаких замен произведено не было. В процессе варьировались значения gap penalty и minimum score threshold. В результате при gap penalty = 12 и minimum score threshold = 15 (и меньше) был найден один инвертированный повтор, соответствующий акцепторному стеблю: SEQUENCE: Score 18: 6/6 (100%) matches, 0 gaps 1 ggggta 6 |||||| 69 ccccat 64 При больших значениях minimum score threshold и том же значении gap penalty программа не находила нужных последовательностей. При других ненулевых значениях gap penalty и значении minimum score threshold меньше 15 находился только один стебель (при очень низких значениях, содержащий гэпы). При понижении gap penalty до 0 было получено следующее: SEQUENCE: Score 72: 24/24 (100%) matches, 20 gaps 1 ggggt------a-tcgccaag---cggtaag-gcaccgg-attc 32 ||||| | ||| || ||| || | |||| | || 69 ccccatgctcctaagc--tt-ggagcc-tt-ac--ggcctt-ag 34 В найденном стебле очень много гэпов, поэтому использовать его для предсказания структуры тРНК невозможно. Предсказание вторичной структуры тРНК по алгоритму Зукера Алгоритм Зукера реализует программа mfold. Я пользовалась online-версией. Программа запускалась несколько раз, при этом варьировался параметр Р (percent suboptimality), он указывает, на сколько процентов выдаваемое предсказание структуры может отличаться по своей вычисленной энергии от оптимального. Чем больше значение этого параметра, тем больше вариантов предсказания было на выходе. При Р=5 была найдена 1 структура с 3-мя стеблями (не подходит, т. к. у тРНК 4 стебля). При Р=10 - 2 структуры, 3 стебля и в той и в другой. При Р=15 - 4 структуры, 3-ая содержит 4 стебля, остальные - по 3 стебля. При Р=20 были найдены те же 4 структуры, что и при Р=15, но к ним добавилась 5-ая, содержащая 5 стеблей и имеющая строение, нетипичное для тРНК. Дальнейшее увеличение Р-параметра я сочла ненужным, нам подходит структура №3, полученная при Р=15. Она и приведена на рис. 1. Рис. 1. Предсказанная вторичная структура тРНК из файла 1GTR.pdb. Изображение получено с помощью программы mfold. Таблица 1. Сравнение кристаллической структуры тРНК 1GTR c предсказанными структурами этой тРНК в программах einverted и mfold
Поиск ДНК-белковых контактов в заданной структуреПоиск ДНК-белковых контактов производился в помощью программы Jmol. Для этого сначала были определены следующие множества атомов:
Таблица 2. Различные ДНК-белковые контакты в комплексе 1RH6.pdb
С помощью программы nucplot была получена схема ДНК-белковых контактов. На вход программе подавался файл в старом формате PDB - 1RH6_old.pdb. Полученное изображение приведено на рис. 2. Исходный файл *.ps можно скачать здесь. Рис. 2. Схема ДНК-белковых контактов структуры 1RH6. Изображение получено с помощью программы nucplot. Аминокислотный остаток с наибольшим числом указанных на схеме контактов с ДНК - Arg23 (2 контакта с ДНК). Thr4 также имеет 2 контакта с ДНК, но это контакты через молекулу воды. Наиболее важным для распознавания последовательности ДНК, по моему мнению, также будет Arg23, т. к. у него самое большое количество контактов с азотистыми основаниями ДНК. С помощью программы Jmol было создано изображение контактов Arg23 с ДНК. Оно приведено на рис. 3. Рис. 3. Контакт Arg23 с ДНК из структуры 1RH6. Аминокислотный остаток Arg23 и связанные с ним азотистые остования (5-ый гуанин и 6-ой тимин) показаны в проволочной и шариковой модели, окраска по типу атомов. Остальная часть молекулы ДНК показана в проволочной модели и выделена зелёным цветом. Изображение получено с помощью программы Jmol.
© Shvetsova Ekaterina, FBB MSU, 2013 |