Занятие 2. Банк UniProt
1. Извлеките из банка UniProt документ, содержащий информацию о вашем белке
Прорамма entret на сервере kodomo умеет извлекать записи из локальных банков данных. Чтобы получить документ для вашего белка, задайте в качестве аргумента строку: sw:<ID_вашего_белка>.
2. Откройте документ программой less и заполните таблицу:
Метка поля
Содержание
Код(ы) доступа ("Accession number")
Идентификатор записи в БД
Название (краткое описание) белка
Дата создания документа
Дата последнего исправления аннотации
Число публикаций, использованных при создании документа
Журнал и год самой поздней публикации
Ключевые слова
Что содержит поле комментариев?
Идентификаторы записей PDB
3. Ответьте (хотя бы) на один вопрос о вашем белке
Выберите те вопросы из списка, ответы на которые можно найти в записи Uniprot, относящейся к вашему белку. Также можно использовать публикации о вашем белке, найденные в БД PubMed
4. Определите, сколько белков в UniProt имеют тот же код белка или примерно то же описание (DE), что и Ваш белок и заполните таблицу
Команда/Запрос
Число записей в SwissProt
Число записей в TrEMBL
Для поиска в Swissprot используйте команду infoseq, заменив код организма звездочкой - как в заданиях предыдущего практикума. Результат - только описания белков, выдаваемые на stdout для контроля. (Куда и что выдавать управляется параметрами команды). Для подсчета перенаправьте выходной поток команде wc (см. wc --help для выбора правильного параметра)
Зайдите на сайт UniProt: http://www.uniprot.org/
- В верхней части страницы увидите Search in...Query...
- В окошке Search in выберите UniProtKB, а в окошко Query введите запрос — одно или несколько слов из описания вашего белка, нажмите "Search". Если вы хотите искать словосочетание, то заключите его в кавычки: "например так".
- В верхней части страницы с результатами поиска найдите информацию о числе находок.
Дополнительное задание
5.(*) Сравните запись своего белка с записью одного белка с похожим описанием
- Выберите один из белков (по возможности с наиболее похожим описанием, но из другого организма), перейдите на его страницу по гиперссылке его Accession
- Эта гиперссылка ведет на html-страничку, содержащую информацию из записи, оформленную в специальном "дружественном к пользователю" виде. Имеет смысл изучить такую страничку и возможности, там предоставленные.
- Получить запись в TXT формате вы можете либо с помощью программы entret, либо дописать .txt в поле браузера
- Заполните таблицу.
Метка поля
Белок 1
Белок 2
Первый код доступа
Идентификатор последовательности в БД
Название (краткое описание) белка
Дата создания документа
Дата последнего исправления аннотации
Название организма
Классификация организма (список таксонов)
Длина последовательности
Молекулярная масса белка
Число публикаций, использованных при создании документа
Журнал и год самой поздней публикации
Описание вторичной структуры
Ключевые слова
Темы, освещённые в комментариях
Особенности последовательности
Идентификаторы записей PDB
- Прокомментируйте результаты сравнения двух записей.
Оформление результатов
Создайте страницу "Белок в Uniprot" на своем сайте. Ссылка на неё - со страницы "Проекты => Белок" и со страницы второго семестра. Кроме результатов выполнения заданий приветствуются (и оцениваются) комментарии.
Кстати, со страницы "Проекты => Белок" логично поставить ссылки на ваши работы о пространственной структуре белка
Добавьте команды wc, entret, showdb в соответствующие разделы ("bash" и "EMBOSS") страницы с описанием команд.