Учебная страница курса биоинформатики,
год поступления 2017
Банки нуклеотидных последовательностей
Отчёт — страница со ссылкой со страницы семестра. Срок без штрафа — полночь с 23 на 24 октября, с минимальным штрафом — до начала второй пары 30 октября.
1. Охарактеризуйте качество сборки генома эукариотического организма
Организм (точнее, вид) — на ваш выбор; используйте NCBI Genome, Browse by organism или поиск по БД Genome.
- В отчёте укажите:
- название вида (латинское и русское); если организм не общеизвестный (как, например, лошадь), то краткое описание, можно с фотографией;
- число сборок генома;
- для одной сборки (укажите, какой):
- общую длину;
- число контигов и скэффолдов сборки;
- N50 и L50;
- число аннотированных белков;
- ссылку на публикацию с описанием проекта (если есть);
ссылку на последовательность одного из контигов (на ваш выбор) в RefSeq.
2. Опишите семь ключей, используемых в таблицах особенностей
- Найдите страницу help'а; можно искать на сайте NCBI, EBI или (что самое простое!) INSDC
- Выбирайте ключи поинтереснее! Впрочем, выбор за вами.
- На каждый ключ приведите пример.
3. Опишите состояние дел в одном из массовых геномных проектов
Возьмите один из проектов, перечисленных в презентации, или найдите какой-нибудь другой (+1 премиальный балл).
Ожидаемая информация: название проекта, цель, год начала, ссылка на страницу, организация, страна, планируемые число геномов, год завершения, сколько геномов секвенировано на настоящее время, последняя публикация по проекту (ссылка на PubMed).
4. Составьте таблицу митохондриальных генов одного из организмов указаного таксона
- Поиск по ENA (EMBL) на сайте EBI или по нуклеотидным банкам на сайте NCBI.
- Выбор представителя таксона за вами.
- В отчёте привести:
- где искали, текст запроса;
если искали в ENA: сколько находок в Release и сколько в Update; если на NCBI — сколько в GenBank и сколько в RefSeq
- выбранный организм: название (латинское и по возможности русское), желательно фотографию, AC выбранной записи банка;
ссылку на таблицу генов белков, закодированных в митохондриальном геноме: короткое название гена, полное название, координаты и ориентация в геноме; идентификатор в БД белков; сортировка — по порядку в геноме.