Учебная страница курса биоинформатики,
год поступления 2011
Задание 3. Поисковые системы
В директории .../Pr3 создайте файл для протоколирования текущих результатов. Итоговые результаты нужно оформить на вашей html странице
1. С помощью SRS найдите ваш белок в банке SwissProt и опишите не менее трех "особенностей" (features) в его аминокислотной последовательности
На странице Library page отметьте UniPRotKB/Swiss-Prot
Выберите Standard Query Form
В одном из полей запроса выберите ID и внесите в окошко идентификатор вашего белка (или выберите Accession Number и внесите в окошко код доступа белка).
Нажмите Search. Проследуйте по гиперссылке в левом столбце таблицы.
- Выберите очередную особенность. Рекомендую выбрать такую, которая относится к целому участку, а не к одному остатку. Пройдите по гиперссылке. Сохраните информацию об особенности в протоколе для последующего оформления на сайте(в данном случае проще скопировать с экрана). Опишите своими словами в чем состоит особенность. Последовательность особенности должна быть приведена обязательно.
Составленные описания должны быть представлены на сайте.
2. Получите и сохраните описание всех записей банка трехмерных структур PDB, относящихся к вашему белку
- Вернитесь на страницу находок
Обратите внимание на окошко Apply options to слева. В нем указано к каким находкам буду применяться последующие действия. Отметьте галочкой находку, если сочтете необходимым.
Перейдите по ссылке Link to related information
Выберите банк PDB (придется поискать )
Получив список, сохраните информацию по ссылке Save. Перед сохранением следует следить за тем, что в окошке указано:
сохранение в текстовом формате - File(text)
число Number of entries to download больше числа сохраняемых записей
результат сохраняется в нужном вам виде; в данном случае, Save with view установить на PDBShortView (а можно было бы выбрать Complete entries, или fasta sequences, или др.)
- имя и расширение сохраняемого файла были подходящими
Список структур должны быть представлен на сайте (если всего одна структура, то укажите её).
3. Найдите полноразмерные белки из Firmicutes, выполняющие функцию, сходную с функцией вашего белка
Пользуясь SRS, составьте несколько (не менее двух) запросов к банку Swissprot и заполните Таблицу 3-1
Строка запроса содержится в верхней части страницы с результатами, в окошке Query.
При составлении запроса имейте в виду, что слова, входящие в описание вашего белка, приндексированы независимо друг от друга, поэтому имеет смысл вводить их по одному, соединяя знаком &.
Чтобы исключить записи, содержащие лишь фрагмент последовательности, используйте оператор НО НЕ и тот факт, что слово fragment указывается в поле DE. Составьте запрос и на все последовательности, и на полноразмерные (не фрагменты) только.
- Если описание содержит несколько синонимов (в таблице синонимы названы "формулировками функции"), то имеет смысл сделать несколько запросов - по одному на каждый синоним. Если синонимов нет, ограничьтесь одним запросом.
Для проверки почему запрос не дает ожидаемого результата используйте ссылку i слева от строки запроса, в которой выбрано поле для поиска. Если в открывшееся окошко List values that match введёте искомое слово, и, при необходимости, "*" на конце, то получите полную информацию о его встречаемости в данном поле в данном банке.
В отчете на html странице должна быть заполненная Таблица 3-1.
4. Сохраните полноразмерные последовательности найденных белков в fasta формате
Вернитесь к наиболее подходящему запросу из задания 3. Для этого перейдите по ссылке Results из верхнего меню, отметьте галочкой нужный запрос из списка всех ваших запросов и Return query. Если находок много (больше 10), то отметьте галочками 10 из них, желательно, действительно гомологичных (т.е. родственных) вашему белку. Если находок мало (меньше 10), то ищите по БД Uniprot.
- См. инструкции по сохранению к заданию 2.
На вашей html странице поставьте ссылку на полученный файл с последовательностями. Он потребуется в следующих блоках.
5. Сохраните список последовательностей из задания 4, в котором указаны ID, AC последовательностей, организм (Species), название белка (Description) и длина последовательности
- Вернитесь к стандартной форме запроса, введите тот же запрос (в вашей Таблице 3-1 он указан)
Ниже запроса в разделе Create view выберите нужные поля, Search
- Если необходимо, отметьте те последовательность, которые были сохранены в fasta формате
Сохраните результат: Save. Заказанный вами вид (view) таблицы будет называться SWISSPROT1 или как-то похоже. Сохраните этот вид в файле с подходящим названием и расширением .xls, он представляет из себя плоскую таблицу, которая открывается Excel.
На вашей html странице поставьте ссылку на полученный файл.
Дополнительные задания
(за хорошие премиальные баллы каждое )
6. Опишите изменения, произошедшие с записью вашего белка от первого ее появления в банке Uniprot до последней версии
Воспользуйтесь сервисом expasy.org
Выберите БД UniProt, ищите по идентификатору
Проверьте все находки. Если попадаете на полную запись, то пройдите по ссылке History. Выберите ссылку с наиболее полной историей. (Истории могут отличаться из-за изменения ID записи: по одному ID выдается история записи с этим ID, т.е. не вся история)
Используя сервис на странице History вашей записи опишите различия первой и последней версии записи. (Иногда проще описать что осталось общего )
- На странице html обязательно опишите:
- даты создания сравниваемых версий
- какие изменения претерпели идентификаторы ID и AC
- были ли и какие изменения в последовательности
примеры наиболее важных, с вашей точки зрения, изменений полей; желательно привести скрин-шот изменений (разумных размеров)
- даты переходов из одного банка в другой (если были)
- ваши заключения об истории записи - одна-две фразы
7.Найдите и изучите страницу с описанием поля "Taxonomy" банка Swissprot
В SRS на Library Page щелкните по названию банка. Откроется страница с описанием банка. В нижней части этой страницы имеется список полей; названия полей оформлены как гиперссылки на их описания.
- Пользуясь возможностями, предоставляемыми этой страницей, ответьте на вопросы (ответы внесите в протокол):
- Названия каких таксонов начинаются на "bacil"?
- Сколько в банке Swissprot записей, описывающих белки из рода Bacillus?
- Сколько в банке Swissprot записей, описывающих белки из отдела Firmicutes?
8. Опишите особенности сервиса MRS по сравнению с SRS
- Найдите свою запись в Swissprot
- в окошке выберите Swiss-Prot
- в окошко for внесите id:xxx_bacsu или ac:xxxxxx, нажмите Enter
попробуйте разобраться с тем, как работает ссылка Find similar (я не сумел )
попробуйте находки срезу с нескольких страниц (я не сумел ) ; кнопочка Download появляется только после отметки галочкой одной или нескольких находок.
Впечатления опишите на вашей html странице
9. Найдите записи SwissProt , связанные с научными интересами известного российского (советского)биолога А.А.Нейфаха
- Для тех записей, в которых Нейфах - автор первой публикации, сохраните табличку Excel, включающую описание белка; авторов, название и год публикации.
- Опишите научный интерес Нейфаха.
- Используйте следующие возможности SRS:
- включение символов '*' и '?' в слова запроса.
- на странице запроса задание полей, выводимы в таблицу с результатом, см. задание 5
- выбор находок для сохранения (checkbox): публикации, среди авторов которых нет Нейфаха, следует убрать из таблицы.
- возможности сохранения (save)
Приведите запрос и таблицу Excel на вашей html странице.
10. Опишите несколько наиболее существенных отличий в формате записи вашего белка в БД Proteins на сайте NCBI от формата Uniprot
The National Center for Biotechnology Information (NCBI, США www.ncbi.nlm.nih.gov/
Поисковая система называется Entrez. Её окно поиска есть на всех страницах NCBI
- Выберите БД Proteins и ищите по Uniprot идентификаторам вашего белка.
Комментарии об Entrez и различиях в форматах поместите на вашей html странице.