Учебная страница курса биоинформатики,
год поступления 2011
Первое занятие второго блока
Отчёты по упражнениям должны быть к следующему занятию выставлены на веб-страницы, на которые должны вести надлежащим образом оформленные гиперссылки со страницы третьего семестра.
1. Знакомство со структурой банка EMBL посредством поисковой системы SRS
При выполнении упражнения пользуйтесь SRS на сайте EBI: srs.ebi.ac.uk
a. Посмотрите и приведите в отчёте дату последнего проиндексированного в системе релиза EMBL и количество записей в нём.
Указание: с "Library Page" последуйте по гиперссылке "EMBL (release)".
b. Посмотрите и приведите в отчёте список классов ("Data Class") банка EMBL — их обозначения и описания (по-английски), а также число записей каждого класса, проиндексированных SRS для последнего релиза EMBL. Укажите, записи каких классов не проиндексированы в SRS.
Указание: с "Library Page" последуйте по гиперссылке "EMBL (release)". На открывшейся странице внизу в списке полей найдите "Data Class" и последуйте по соответствующей гиперссылке. Скопируйте обозначения и описания в отчёт. Чтобы узнать число записей, нажмите кнопку "List values".
c. Посмотрите и приведите в отчёте список разделов ("Divisions") банка EMBL. Для каждого раздела, кроме обозначения, приведите его описание по-русски и число записей в последнем релизе.
d. (* – дополнительное). Выберите три-четыре раздела банка EMBL (например, HUM, ENV и PRO). Определите, сколько стандартных (класса STD) записей появилось в каждом из этих разделов за январь--март (или другой период до выхода последнего релиза) 2012 года и за тот же период 2011 года. Оформите результаты в виде столбчатой диаграммы. Желательны выводы (об ускорении/замедлении поступлений в данные разделы).
2. Описание гена в записи банка EMBL
В таблице найдите против своей фамилии имя гена, описанного в записи EMBL с кодом доступа BA000025 (файл с записью лежит в директории P:\y11\Term_3\Block_2). Для этого гена укажите: направление гена относительно направления, выбранного для записи (прямое или обратное), число кодирующих участков, длины первого и последнего кодирующих участков, длины первого и последнего интронов между кодирующими участками.
3. Нахождение белка по фрагменту гена
Вырежьте самый длинный кодирующий участок в отдельный файл. (Указание: воспользуйтесь программой seqret с опцией -sask). Зайдите на страницу http://blast.ncbi.nlm.nih.gov/ и разберитесь, какой программе и как подать на вход этот участок, чтобы найти в Swiss-Prot соответствующий белок. Напишите краткую "инструкцию" (как выполнять подобный поиск) и приведите результаты своего поиска (нашёлся ли белок, если да, то какой, и какой участок этого белка соответствует вашему экзону).
4. Ссылки из записи банка Swiss-Prot на записи банка EMBL
В записи Swiss-Prot, описывающей ваш белок, найдите все ссылки на банк EMBL.
Указание: запись Swiss-Prot получите программой entret (если забыли обозначение банка, выполните сначала команду showdb).
C помощью SRS получите информацию, необходимую для заполнения следующей таблицы. Если записей окажется очень много, то можно ограничиться первыми пятью. Сравните характеристики разных записей в кратком резюме.
Таблица. Записи EMBL, в которых описан ген белка XXXXXX
ID записи |
Тип молекулы |
Класс данных |
Дата внесения в банк |
Описание |
Длина последовательности |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Указания: На страничке "Library page" поставьте галочку против EMBL, затем нажмите кнопку "Standard Query Form". Поиск ведите по полю "Accession number", пользуясь логическим оператором "ИЛИ". Создайте один запрос, позволяющий сразу получить всю нужную информацию и только ее. Для этого в окошке "Choose 1 or more fields" (с помощью мыши и клавиши <Ctrl>) выберите поля: ID, Molecule, Data class, Sequence Length, Entry Creation Date, Description. Сохраните результаты поиска в виде таблицы (кнопка "Save").