Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

Практикум 5. UniProt

Формат отчета: HTML страница, со ссылкой со страницы семестра, содержащая:

  1. Таблицу со следующей информацией о своём белке: UniProt ID, UniProt AC, RefSeq ID, PDB ID, длина, молекулярная масса, рекомендуемое UniProt название. Комментарий к таблице.

  2. Описание кластеров UniRef для своего белка.

  3. Результаты сеансов поиска в UniProt.

  4. Результаты дополнительных заданий (если вы их делали).

Есть заготовка для страницы, нужно скопировать её куда-нибудь внутрь тега <body> пустой страницы, например, между header и footer. Внутри заготовки Вам нужно поменять все #FIXME на что-нибудь содержательное.

Перед отправкой страницы на проверку запустите валидаторы HTML и CSS. Не буду проверять невалидные страницы.

Дедлайны: 02:00 a.m. 20 марта (мягкий) и 02:00 a.m. 27 марта (жесткий).

Задания

1. Найти информацию о своем белке в UniProt

2. Описать кластеры UniRef своего белка

Для каждого белка UniProt есть ровно по одному кластеру в UniRef50, UniRef90 и UniRef100. Есть разные способы, чтобы их найти. Разберитесь сами. Подсказка: в строке поиска в начале страницы можно выбрать базу, по которой искать, а еще есть вариант с уже знакомой вам формой "Retrieve/ID mapping". Можно поизучать отформатированную страницу белка, но на ней могут быть не все кластеры, особо любопытные могут разобраться, в каких случаях.

Для отчета вам нужно найти ID, названия и размер кластеров UniRef.

3. Провести несколько сеансов поиска в UniProt

Окно поиска в UniProt поддерживает специальный синтаксис запросов. Для формирования запросов можно воспользоваться кнопкой Advanced, думаю там сами разберетесь, если что – пишите письма и задавайте вопросы.

Для каждого сеанса поиска Вам нужно будет указать текст запроса (появляется в окне поиска после формирования запроса), сколько нашлось белков, сколько из них – из раздела Reviewed (т.е. Swiss-Prot), другие моменты, заслуживающие внимания.

Если в окно поиска ввести какой-нибудь текст нажать Search, то UniProt будет искать каждое слово из запроса во всем тексте каждой из записей. Поиск "по названию" везде ниже означает поиск не по всему тексту записи, а только по полю DE.

Сеансы поиска:

4. [дополнительное] Найти различия в записях UniProt и RefSeq Protein

Найдите запись (записи) RefSeq Protein, соответствующие своему белку, и опишите, чем отличается информация, предоставляемая записью RefSeq, от информации UniProt.

5. [дополнительное] Изучите историю изменений записи UniProt

Для каждой записи хранится история её изменений, которую можно посмотреть, нажав на кнопку History. Не обязательно описывать историю изменений своей записи, можете выбрать любую, главное, чтобы было интересно (хоть чуть-чуть).

6. [дополнительное] Изучите ключи таблицы локальных особенностей (Feature Table)

Используя Help на сайте UniProt изучите и приведите примеры того, как представлено в записи UniProt одно из следующих явлений: