Занятие 3.
Поисковая система SRS
Ваша рабочая директория H:\Term2\Practice3.
Рекомендуем пользоваться SRS на сервере EBI:
http://srs.ebi.ac.uk/
Обязательные задания
Скопируйте в свою рабочую директорию файл
SRS_tables.doc и откройте его в Word.
Задание состоит в заполнении таблиц в этом файле.
- Информация о банках данных (страница Library Page).
- Определите, в каких группах находятся банки данных
"MEDLINE", "UniProtKB", "UniRef100", "EMBL" и "PDB". Результаты
занесите в таблицу 1.
- Поля банков данных и индексы (страница с описанием
индекса поля таксономии банка Swiss-Prot).
- Какие таксоны в документах Swiss-Prot начинаются на "ga"?
- Определите английский эквивалент таксона
"гамма-протеобактерии" и количество документов
в банке Swiss-Prot, описывающих белки
из этого таксона. Результаты занесите в таблицу 2.
- Поиск своего белка и сохранение.
- На странице Library Page выберите для поиска банк
Swiss-Prot ("UniProtKB/Swiss-Prot"), перейдите на страницу Standard Query Form.
- Найдите свой белок по Accession number
- Проанализируйте строку запроса
- Занесите строку запроса и количество найденных
документов в таблицу 3.
- Сохраните последовательность своего белка в файле
P00000.fasta в формате "FastaSeqs" (вместо P00000 подставьте
AC своего белка).
- Составьте выборку белков из таксона "гамма-протеобактерии", которые
выполняют функцию, сходную с функцией вашего белка (заполните таблицу 4).
- Выберите для поиска банк UniProtKB/Swiss-Prot.
- Найдите все документы, описывающие белки из таксона
"гамма-протеобактерии", которые в поле DE содержат нечто, достаточно сходное
с описанием функции вашего белка.
- Отобразите результат поиска в разных предопределенных форматах
(UniprotView, UniprotFeatureView, ...)
- Отобразите результат поиска так, чтобы отображались
только поля с кодом доступа (Accession number), названием вида (Species) и
таксономией (Taxonomy). Отсортируйте по названию организма.
- Занесите в таблицу 3 строку запроса и количество найденных
документов, а в таблицу 4
соответствующую информацию про найденные белки.
- Сохраните все найденные документы в fasta-формате в файле с названием
gamma_proteins.fasta.
Примечание. Если количество найденных документов окажется
существенно больше 50, в таблицу 4 занесите информацию только о первых 50.
См. указания.
Если все обязательные задания сделаны, можете приступать к
дополнительным заданиям.