|
|
Освоение навыков работы в Uniprot и DOOR2 |
|
На предыдущих занятия по практической биоинформатике мы уже познакомились со многими базами : GBK (genBank), EMBL (база данных нуклеиновых последовательностей) и PubMed (база данных публикаций).
На этот раз нам предожили ознакомиться с другими базами данных : Uniprot, SwissProt, TrEMBLE - всё это базы данных последовательностей белков. Первым заданием был перевод идентификатора белка из базы RefSeq-protein в идентификатор Uniprot (ID - mapping). Для этого на сайте Uniprot ( Uniprot Official Site ) заходим во вкладу Id-mapping выше поиска. Там выбираем в верхней строке RefSeq-protein, в нижней - UniProtKB AC. В левом окне вводим идентификатор в формате RefSeq-protein; в моем случае - NC_000921.1. Нажимаем Map. Результат для моего белка : IPYR_HELPJ. Далее было предложено найти ортологов моего белка (2штуки) и результаты сравнения записать в таблицу. Для поиска ортологов (ортологи - это гомологичные последовательности, разделившиеся в результате видообразования и выполняющие сходные функции) нажимаем Advanced Search. В качестве параметров : Protein name [DE] :Pyrophosphatase; Taxonomy [OC] : Helicobacteraceae. По данному запросу найдено 43 записи. Мой выбор пал на неорганические пирофосфатазы H.pylori штаммов 26645 и B38 соответственно (идентификаторы можно найти в таблице). Таблица сравнения : Таблица . Для получения необходимых файлов с информацией о белках я использовал пакет EMBOSS. Для его использования я подключился к серверу КОДОМО с помощью Putty. Далее использовал конструкцию 3 раза : entret uniprot:ID. Нужные строки из файлов я получал либо просмотром файла с помощью less filename, либо с помощью grep ^CODE filename. В качестве второго задания был ответ на любой вопрос из 3 из данного списка : Список вопросов . Ответы я предоставил в таблице 2, находящейся под таблицей 1. Вопрос - ответ:
В качестве 1 из дополнительных заданий было предложено поискать ортологов данного мне белка в других базах: запрос составленный в Advanced Search : Helicobacteraceae AND Pyrophosphatase. В базе данных Swiss-prot - 27; TrEMBLE - 1550. Из этого можно сделать вывод , что база данных TrEMBLE содержит больше файлов, но они непроверенные и часть из них получена с помощью гипотетической гомологии, как и выданный мне белок. Следующим заданием было знакомство с базой оперонов - DOOR2. Оперон - группа функционально связанных между собой генов, детерминирующих синтез белков-ферментов, относящихся к последовательным этапам какого-либо биохимического процесса. Для поиска нужной записи я использовал запрос : Helicobacter Pylori J99 | atpA. Запись оказалась единственной. Рисунок 1. Структура оперона atpA H.pylori J99, полученного с помощью базы DOOR2. Если сравнивать данный результат с полученным мною раннее( Ранний результат ), можно сделать вывод, что полученный мною результат это лишь часть общей картины, хоть и гипотетической, так как DOOR2 предсказывает лишь структуру оперона с точностью 90%. Сводная таблица из базы DOOR2 приведена ниже.Таблица 1. Таблица оперона, полученная из базы DOOR2, является обобщением полученных мною раньше результатов. |
|
|
Просвиров Кирилл. 2013. | Дата последнего изменения: 22 марта 2014. |