Учебная страница курса биоинформатики,
год поступления 2014
Указания
Uniprot
1.Синтаксис языка запросов (англ.)
- Как найти код протеома?
- Заходите в раздел Proteoms
- Поиск по таксону или организму. Например, organism:"escherichia coli" или taxonomy:escherichia. Референсный геном отмечен в списке. Понятно ли, почему в одном случае поставлены кавычки, а в другом – нет?
- Можно использовать * в тех местах, в которых вы не уверены в правильном написании слова. Например, organism:"es*her*hia coli"
- Как ограничить поиск одним протеомом?
- надо к запросу добавить указание кода протеома. Например, name:"transcription factor" AND proteome:up000000625
- Можно ли вместо указания кода протеома указать название организма?
- Нет, потому что в Uniprot могут лежать несколько протеомов одного и того же вида и даже одного и того же штамма. Их трудно будет разделить.
- Как указать, что чего-то не должно быть?
- Пример: name:"secretion system" NOT "type IV"
- Запрос к полю Features
- Пример: annotation:(type:mod_res phosphothreonine) AND proteome:up000000431
- выбираются записи, в которых в поле Features (FT) имеется ключ MOD_RES и описание этого ключа содержит слово Phosphothreonine
Страницу со списком ключей Features ищите по ссылкам из мануала
- Пример: annotation:(type:mod_res phosphothreonine) AND proteome:up000000431
- Для упражнения 3 нужен ключ METAL и значение Iron.
Pubmed
- Как указать поиск по авторам?
- Пример Smith S[au] или Li[au] или Ivanov IA[au]
- Как указать поиск по названию статьи?
- Пример trans-splicing[ti]
- Полный список полей приведен на странице help.
- Можно ли использовать логические операторы?
- Да, конечно.
- Что такое PMID?
- Идентификатор записи в Pubmed
- Какие фильтры стоит применять при поиске публикаций по теме?
- Во-первых, фильтр Review, так как обзоры часто понятнее статей на узкую тему
- Во-вторых, фильтр Free text, означающий достут к полному тексту публикации. МГУ подписан на ряд журналов. Поэтому с IP адресов компьютеров МГУ доступны некоторые тексты, не помеченные Free.
- Фильтры слева на странице
- Как сохранить найденные статьи в формате Excel?
Send to (справа сверху) => File => Format: CSV (открывается Excel'ем)
- Какие еще удобные возможности?
- Clipboard - отправляйте туда статьи, отобранные за сессию
- Collection - если зарегистрируетесь в Pubmed, то можете создать коллекции и хранить в них нужную литературу.
- Разбирайтесь самостоятельно!
PDB
- Кнопка Advanced search позволяет создавать и выполнять запросы по многим полям PDB файлов. Временами ведет себя капризно, но результат бывает полезным. Например, можно отобрать структуры бактериальных рибосом в комплексе с тетрациклином.
- Для получения Excel файла с находками выберите Customizable в окошке Reports и отметьте поля, которые хотите видеть в таблице. Потом сохраните в формате Excel.
Про задание
- При составлении запроса имейте ввиду, что заданное вами ключевое слово может встретиться в названиях совсем не тех белков, которые вам нужны!
- Например
- запрос name:ribonuclease выдаст также белки ribonucleas inhibitor
- запрос name:chaperone выдает также chaperone binding protein и chaperone regulator - совсем другие белки!
- Например
- Ваша задача - так составить запрос, чтобы получить требуемые белки, и только их!
- При обнаружении лишних находок надо модифицировать запрос: использовать оператор NOT.
- например, так: name:chaperone NOT name:binding
- При обнаружении лишних находок надо модифицировать запрос: использовать оператор NOT.
оказалась недоступной в то время, когда писал задания :(. Доступ по ссылкам такой: Uniprot => help => Technical corner => UniprotKB flat file manual => там найти описание поля FT и в этом разделе есть ссылка на список ключей.