Занятие 2. Поисковая система SRS

 
     

 

Скопируйте в свою рабочую директорию файл SRS_tables.doc и откройте его в Word. Задание состоит в заполнении таблиц в этом файле.

Рекомендуем пользоваться SRS на сервере EBI: http://srs.ebi.ac.uk/

  1. Информация о банках данных (страница Library Page).
    • Определите, в каких группах находятся банки данных Swiss-Prot, EMBL и PDB. Результаты занесите в таблицу 1.
  2. Поля банков данных и индексы (страница с описанием индекса поля таксономии банка Swiss-Prot).
    • Какие таксоны в документах Swiss-Prot начинаются на "ga"?
    • Определите английский эквивалент таксона "гамма-протеобактерии" и количество документов в банке Swiss-Prot, описывающих белки из этого таксона. Результаты занесите в таблицу 2.
  3. Поиск своего белка и сохранение.
    • На странице Library Page выберите для поиска банк Swiss-Prot, перейдите на страницу Standard Query Page.
    • Найдите свой белок по Accession number
    • Проанализируйте строку запроса
    • Занесите строку запроса и количество найденных документов в таблицу 3.
    • Сохраните последовательность своего белка в файле P00000.fasta в FASTA формате (вместо P00000 подставьте AC своего белка).
  4. Составьте выборку белков из таксона "гамма-протеобактерии", которые выполняют функцию, сходную с функцией вашего белка (заполните таблицу 4).
    • Выберите для поиска банк UniProt.
    • Найдите все документы, описывающие белки из таксона "гамма-протеобактерии", которые в поле DE содержат описание функции вашего белка.
    • Отобразите результат поиска в разных предопределенных форматах (UniprotView, UniprotFeatureView, ...)
    • Отобразите результат поиска так, чтобы отображались только поля с именем документа (ID), кодом доступа (Accession number), названием организма (Species) и таксономией (Taxonomy). Отсортируйте по названию организма.
    • Занесите в таблицу 3 строку запроса и количество найденных документов, а в таблицу 4 — соответствующую информацию про найденные белки.
    • Сохраните все найденные документы в FASTA формате в файле с названием gamma_proteins.fasta.
  5. (*) Найдите (одним запросом к банку UniRef100) белки из организмов Yersinia pestis и Vibrio cholerae, которые выполняют функцию, сходную с функцией вашего белка. Занесите информацию о запросе в таблицу 3. Сохраните все найденные документы в FASTA формате в файле с названием yv_proteins.fasta.