Банки нуклеотидных последовательностей

← Term 3

Last updated: 30-10-2017.

Задания:

1. Охарактеризуйте качество сборки генома эукариотического организма
Организм (точнее, вид) - на ваш выбор; используйте NCBI Genome, Browse by organism или поиск по БД Genome
В отчёте укажите
число сборок генома; выберите одну
число проектов по секвенированию организма и число образцов
для одной сборки
приведите описание образца (BIOSAMPLE ID и перевод описания)
приведите описание проекта (BIOPROJECT)
число контигов/скэффолдов сборки
таблицу контигов/скэффолдов (контиг, длина, ...) - ссылка на файл с веб-страницы
N50 и L50, самый длинный и самый короткий контиг
сделайте ссылку на последовательность одного из контигов (на ваш выбор)
2. Опишите семь ключей, используемых в таблицах особенностей
Найдите страницу help'а; можно искать на сайте NCBI, EBI или (что самое простое!) INSDC
Выбирайте ключи поинтереснее! Впрочем, выбор за вами.
На каждый ключ приведите пример.
3. Опишите состояние дел в одном из массовых геномных проектов
Возьмите один из проектов, перечисленных в презентации или найдите какой-нибудь другой (+1 премиальный балл).
Ожидаемая информация: название проекта, цель, год начала, ссылка на страницу, организация, страна, планируемые число геномов, год завершения, сколько геномов секвенировано на 2017 год, последняя публикация по проекту (ссылка на pubmed).
4. Составьте таблицу митохондриальных генов одного из организмов указаного таксона
Выбор таксона за вами
Поиск по полям в БД Nucleotide (NCBI); составьте запросы, находящие все полные митохондриальные геномы таксона в GenBank и !Refseq.
Выбор представителя таксона - за вами.
запросы, находящие все полные митохондриальные геномы таксона и число находок в GenBank и !Refseq
название организма и (желательно) фотографию
ссылку на таблицу генов белков закодированных в митохондриальном геноме: короткое название гена, полное название, координаты и ориентация в геноме; идентификатор в БД белков; сортировка - по порядку в геноме.

© Simon Galkin, 2016