Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Методические указания

entret   <код банка>:<AC или ID записи>

Например:

entret   sw:pax6_human

Все команды EMBOSS понимают такой адрес последовательности. См. USA - Uniform Sequence Address в описании EMBOSS.

Большие и маленькие буквы в идентификаторах команды EMBOSS не различают.

Используйте команду showdb для того, чтобы узнать какие базы данных подключены и как выглядит их код.

  • Совет 1 [ДД]: У большинства из вас база данных, к которой принадлежит белок - это uniprot, а не sw.

  • Совет 2 [ДД]: Если по какой-то причине скачать указанным выше образом файл не получается, это можно сделать прямо с сайта Uniprot. Откройте главную страницу Uniprot, введите идентификатор Вашего белка и когда загрузится страничка с белком - справа вверху выберите оранжевую кнопку text. В окне браузера откроется нужный файл; можете сохранить его и дальше работать с ним.

grep   ^ID   pax6_human

выдаст строчку с меткой ID ("^" - указание на то, что слово ID должно стоять в начале строки)

Используйте Advanced Search в базе данных UniprotKB.

Выберите поле, например, Taxonomy. И термин для поиска, например, Bacillus. Нажмите Add&Search и опять Advanced Search для добавления дополнительного условия поиска. Например, поле Protein name и термин Ribosomal для поиска рибосомальных белков.

В окошке запроса увидите как выглядит ваш запрос. В такой форме запрос можно писать сразу, не используя Advanced Search.

Для выполнения задания ограничьтесь находками из полностью секвенированных геномов - кнопка Show only entries from a complete proteome set. Выбирайте ортологов - хотя бы одного - из базы данных TrEMBL - кнопка Show only .... or unreviewed (nn) (UniProtKB/TrEMBL) entries.

Помните, что на белковую последовательность из TrEMBL, возможно, не смотрели глаза человека! И поэтому ваши предсказания по сходству с записью из Swissprot могут оказаться более точными, чем в аннотации записи из TrEMBL.