Занятие 7. Банк нуклеотидных последовательностей EMBL

Отчёты по упражнениям должны быть выставлены на веб-страницы, на которые должны вести надлежащим образом оформленные гиперссылки со страницы третьего семестра.
  1.  Пользуясь системой SRS (http://srs.ebi.ac.uk/):
    1. Посмотрите и приведите в отчёте дату последнего проиндексированного в системе релиза EMBL и количество записей в нём.
      Указание: с "Library Page" последуйте по гиперссылке "EMBL (release)".
    2. Посмотрите и приведите в отчёте список классов ("Data Class") банка EMBL — их обозначения и описания (по-английски), а также число записей каждого класса, проиндексированных SRS для последнего релиза EMBL. Укажите, записи каких классов не проиндексированы.
      Указание: с "Library Page" последуйте по гиперссылке "EMBL (release)". На открывшейся странице внизу в списке полей найдите "Data Class" и последуйте по соответствующей гиперссылке. Скопируйте обозначения и описания в отчёт. Чтобы узнать число записей, нажмите кнопку "List values".
    3. Посмотрите и приведите в отчёте список разделов ("Divisions") банка EMBL. Для каждого раздела, кроме обозначения, приведите его описание по-русски и число записей в последнем релизе.
       
    4. (*) Выберите три-четыре раздела банка EMBL (например, HUM, ENV и PRO). Определите, сколько стандартных (класса STD) записей появилось в каждом из этих разделов за май (или другой месяц до выхода последнего релиза) 2009 года и за тот же месяц 2008 года. Оформите результаты в виде столбчатой диаграммы. Желательны выводы (об ускорении/замедлении поступлений в данные разделы).
       
  2.  В таблице найдите против своей фамилии имя гена, описанного в записи EMBL с кодом доступа BA000025 (файл с записью лежит в директории P:\y08\Term_3\Block_2). Для этого гена укажите: направление гена относительно направления, выбранного для записи (прямое или обратное), число кодирующих участков, длины первого и последнего кодирующих участков, длины первого и последнего интронов между кодирующими участками.
     
  3.  Вырежьте самый длинный кодирующий участок в отдельный файл. (Указание: воспользуйтесь программой seqret с опцией -sask). Зайдите на страницу http://blast.ncbi.nlm.nih.gov/ и разберитесь, какой программе и как подать на вход этот участок, чтобы найти в Swiss-Prot соответствующий белок. Напишите краткую "инструкцию" (как выполнять подобный поиск) и приведите результаты своего поиска (нашёлся ли белок, если да, то какой, и какой участок этого белка соответствует вашему экзону).
     
  4.  В записи Swiss-Prot, описывающей ваш белок, найдите все ссылки на банк EMBL.
    Указание: запись Swiss-Prot получите программой entret (если забыли обозначение банка, выполните сначала команду showdb).
    C помощью SRS получите информацию, необходимую для заполнения следующей таблицы. Если записей окажется очень много, то можно ограничиться первыми пятью. Сравните характеристики разных записей в кратком резюме.

    Идентификатор записи EMBL Тип молекулы Класс данных Раздел EMBL Дата создания
    документа
    Описание Длина последовательности
                 
                 
                 
                 
    Указания: На страничке "Library page" поставьте галочку против EMBL, затем нажмите кнопку "Standard Query Form". Поиск ведите по полю "Accession number", пользуясь логическим оператором "ИЛИ". Создайте один запрос, позволяющий сразу получить всю нужную информацию и только ее. Для этого в окошке "Choose 1 or more fields" (с помощью мыши и клавиши <Ctrl>) выберите поля: ID, Molecule, Data class, Division, Sequence Length, Entry Creation Date, Description. Сохраните результаты поиска в виде таблицы (кнопка "Save").