Учебная страница курса биоинформатики,
год поступления 2015
Банки нуклеотидных последовательностей
1. Охарактеризуйте качество сборки генома эукариотического организма
- Организм (точнее, вид) - на ваш выбор; используйте NCBI Genome, Browse by organism или поиск по БД Genome
- В отчёте укажите
- число сборок генома; выберите одну
- число проектов по секвенированию организма и число образцов
- для одной сборки
- приведите описание образца (BIOSAMPLE ID и перевод описания)
- приведите описание проекта (BIOPROJECT)
- число контигов/скэффолдов сборки
- таблицу контигов/скэффолдов (контиг, длина, ...) - ссылка на файл с веб-страницы
- N50 и L50, самый длинный и самый короткий контиг
- сделайте ссылку на последовательность одного из контигов (на ваш выбор)
2. Опишите десять ключей, используемых в таблицах особенностей
- Найдите страницу help'а; можно искать на сайте NCBI, EBI или (что самое простое!) INSDC
- Выбирайте ключи поинтереснее! Впрочем, выбор за вами.
- На каждый ключ приведите пример.
3. Опишите состояние дел в одном из массовых геномных проектов
Возьмите один из проектов, перечисленных в презентации или найдите какой-нибудь другой (+1 премиальный балл).
Ожидаемая информация: название проекта, цель, год начала, ссылка на страницу, организация, страна, планируемые число геномов, год завершения, сколько геномов секвенировано на 2016 год, последняя публикация по проекту (ссылка на pubmed).
На своей странице - краткое описание на русском.
Если не все сумели найти - не огорчайтесь. Главное - чтобы было интересно!
4. Составьте таблицу митохондриальных генов одного из организмов указаного таксона
Таксон см. в в таблице
Поиск по полям в БД Nucleotide (NCBI); составьте запросы, находящие все полные митохондриальные геномы таксона в GenBank и !Refseq.
- Выбор представителя таксона - за вами.
- В отчет включите:
запросы, находящие все полные митохондриальные геномы таксона и число находок в GenBank и !Refseq
- название организма и (желательно) фотографию
ссылку на таблицу генов белков закодированных в митохондриальном геноме: короткое название гена, полное название, координаты и ориентация в геноме; идентификатор в БД белков; сортировка - по порядку в геноме.