Освоение навыков работы в Uniprot и DOOR2

На предыдущих занятия по практической биоинформатике мы уже познакомились со многими базами : GBK (genBank), EMBL (база данных нуклеиновых последовательностей) и PubMed (база данных публикаций). На этот раз нам предожили ознакомиться с другими базами данных : Uniprot, SwissProt, TrEMBLE - всё это базы данных последовательностей белков.
Первым заданием был перевод идентификатора белка из базы RefSeq-protein в идентификатор Uniprot (ID - mapping). Для этого на сайте Uniprot ( Uniprot Official Site ) заходим во вкладу Id-mapping выше поиска. Там выбираем в верхней строке RefSeq-protein, в нижней - UniProtKB AC. В левом окне вводим идентификатор в формате RefSeq-protein; в моем случае - NC_000921.1. Нажимаем Map. Результат для моего белка : IPYR_HELPJ.
Далее было предложено найти ортологов моего белка (2штуки) и результаты сравнения записать в таблицу. Для поиска ортологов (ортологи - это гомологичные последовательности, разделившиеся в результате видообразования и выполняющие сходные функции) нажимаем Advanced Search. В качестве параметров : Protein name [DE] :Pyrophosphatase; Taxonomy [OC] : Helicobacteraceae.
По данному запросу найдено 43 записи. Мой выбор пал на неорганические пирофосфатазы H.pylori штаммов 26645 и B38 соответственно (идентификаторы можно найти в таблице). Таблица сравнения : Таблица .
Для получения необходимых файлов с информацией о белках я использовал пакет EMBOSS. Для его использования я подключился к серверу КОДОМО с помощью Putty. Далее использовал конструкцию 3 раза : entret uniprot:ID. Нужные строки из файлов я получал либо просмотром файла с помощью less filename, либо с помощью grep ^CODE filename.
В качестве второго задания был ответ на любой вопрос из 3 из данного списка : Список вопросов . Ответы я предоставил в таблице 2, находящейся под таблицей 1. Вопрос - ответ:
  • Какие ионы связываются с белком? --- Со всеми белками связываются ионы магния Mg2+ в количестве 5 штук.
  • В какой части бактериальной клетки локализован Ваш белок? На какой участок вашего белка Вы бы стали воздействовать,чтобы помешать его правильной локализации в клетке? --- Все белки локализуются в цитоплазме. В качестве одной из мутация, возможно, подошла бы мутация концевой аминокислоты к которым крепится маркер, благодаря которому белок прицепляется к ЭПР.
  • Опишите функцию и состав комплекса, в который входит данный белок. --- Функция белков - гидролиз дифосфат-иона. Они не входят в комплекс, а сами являются белками с 4 структурой.

В качестве 1 из дополнительных заданий было предложено поискать ортологов данного мне белка в других базах: запрос составленный в Advanced Search : Helicobacteraceae AND Pyrophosphatase. В базе данных Swiss-prot - 27; TrEMBLE - 1550. Из этого можно сделать вывод , что база данных TrEMBLE содержит больше файлов, но они непроверенные и часть из них получена с помощью гипотетической гомологии, как и выданный мне белок.

Следующим заданием было знакомство с базой оперонов - DOOR2. Оперон - группа функционально связанных между собой генов, детерминирующих синтез белков-ферментов, относящихся к последовательным этапам какого-либо биохимического процесса. Для поиска нужной записи я использовал запрос : Helicobacter Pylori J99 | atpA. Запись оказалась единственной. img1

Рисунок 1. Структура оперона atpA H.pylori J99, полученного с помощью базы DOOR2.

Если сравнивать данный результат с полученным мною раннее( Ранний результат ), можно сделать вывод, что полученный мною результат это лишь часть общей картины, хоть и гипотетической, так как DOOR2 предсказывает лишь структуру оперона с точностью 90%. Сводная таблица из базы DOOR2 приведена ниже. img2

Таблица 1. Таблица оперона, полученная из базы DOOR2, является обобщением полученных мною раньше результатов.



Просвиров Кирилл. 2013.