Учебная страница курса биоинформатики,
год поступления 2014
Uniprot, Refseq Proteins: структура записи
Работайте со своим белком, см. таблицу.
Результат должен быть представлен на странице вашего сайта, включая:
- Название белка
- Табличку идентификаторов в разных базах данных
- Комментарий об изменениях в записи Uniprot по сравнению с первой версией с примерами
- Комментарий о различиях в информации в записях Unipfot и Refseq; ссылки на обе записи в текстовом формате в своей поддиректории
- Ссылку на Excel Табличку с информацией из записей, относящихся к нескольким гомологичным белкам; комментарии о различиях.
Можно эту информацию поместить на страничку белка из первого семестра, отделив новые данные. Ссылка со страницы второго семестра ОБЯЗАТЕЛЬНА.
При просмотре записи Uniprot пользуйтесь ТОЛЬКО текстовым форматом!
Со страницы записи Format => Text
1. Найдите идентификаторы записей своего белка в базах данных Uniprot, Uniref50, RefSeq Proteins, PDB (если есть)
Используйте сервис Uniprot Retrieve/ID mapping. Данный вам идентификатор - из БД Refseq Proteins, см. Недавно введен идентификатор белковой последовательности вида WP_..., он не успел попасть на эту страницу.
Сначала найдите код доступа записи в Uniprot, а по нему - идентификаторы в др. БД, включая Refseq (могут найтись новые, в частности, вида WP_...).
2. Опишите историю изменений записи Uniprot для своего белка
Откройте запись в Uniprot => History => Previous versions
- Сравните последний вариант записи с первым (кнопка Compare для отмеченных версий)
- Напишите комментарий об изменениях, приведите примеры; см. указания
3. Сравните запись Uniprot вашего белка с записями двух (или более, но не более пяти) гомологочных белков из геномов других бактерии или архей
- Как найти коды доступа (AC) гомологов:
- Перекодируйте pdb код гомолога в AC Uniprot (обязательный пункт; но возможно, что получите AC вашего белка)
- Откройте кластер вашего белка в Uniref50 и возьмите AC других представителей кластера
- Резервный вариант: поиск в Uniprot по названию вашего белка; выберите, по возможности, находки из родственных бактерий или архей.
- Введите все AC в окошко поиска Uniprot KB (естественно, используя оператор OR) и получите таблицу
- Выберите колонки для таблицы в соответствии с указаниями и сохраните в формате Excel
- Опишите наиболее существенные различия в описаниях
4. Приведите пример того, как представлено в записи Uniprot одно из следующих явлений (на ваш выбор)
- Пирролизин в последовательности белка
- Селеноцистеин в последовательности белка
- Пост-трансляционная модификация белка
- Изоформы белка – продукты альтернативного сплайсинга
- Сайты белка, участвующие в связывании с ДНК
- Дисульфидные связи в белке
- Удаление инициаторного метионина
- Аминокислотные остатки, участвующие в связывании иона
- Полиморфизм, варианты последовательности
Не обязательно выполнять это задание на примере своего белка, см. указания.
Дополнительное задание
5.(*) Сравните аннотации записей своего белка в Uniprot и Refseq Proteins. Опишите разницу в содержании
- См. указания