Учебный сайт Сергея Маргасюка

Банки нуклеотидных последовательностей

Характеристика сборки генома Picoides pubescens

Опишем сборку генома Picoides pubescens, пушистого дятла (сборка GCA_000699005.1 в NCBI). Это единственная сборка генома этого организма. Сборка относится к проектам PRJNA212874 и PRJNA263502 (в рамках первого выполнено помещение сборки в NCBI, в рамках второго — перенос сборки в RefSeq). В проектах использовался только образец SAMN02314405 (самка, поймана в США).

Для сборки N50 равен 24809 (при средней длине гена порядка 1000 нуклеотидов такое значение N50 представляется достаточно хорошим), L50 — 12353; длина контига от 200 до 299159 нуклеотидов. Далее представлена ссылка на таблицу контигов сборки: ссылка. Приведем ссылку на последовательность достаточно длинного контига (20520 нуклеотидов): ссылка

Описание ключей таблиц в базе данных NCBI

Опишем несколько ключей, используемых в базе данных NCBI:

Описание геномного проекта Human Microbiome Project

Human Microbiome Project — коллекция данных о микроорганизмах, живущих в теле человека: бактерий, архей, вирусов и эукариот. Эти организмы обычно не наносят вреда человеку и выполняют ряд важных функций, в том числе синтез витаминов, обучение иммунной системы и борьбу с болезнетворными микроорганизмами.

В отличие от данных, получаемых методами традиционной микробиологии, информация, полученная в рамках проекта позволяет судить не только об отдельных видах, но о целых сообществах микроорганизмов, существующих в различных зонах внутри человеческого организма.

Приведем информацию по геномному проекту HMP:

Построение списка генов в митохондриальном геноме Paracercomonas marina

Для поиска всех полных митохондриальных геномов таксона Rhizaria были использованы следующие запросы в NCBI Nuceotide:

Рассмотрим митохондриальный геном Paracercomonas marina. В результате поиска с запросом mitochondrion[Title] AND ("complete sequence"[Title] OR "complete genome"[Title]) AND "Paracercomonas marina"[Organism] AND ((ddbj_embl_genbank[filter]) OR (refseq[filter])) был получен митохондриальный геном. Далее представлена ссылка на таблицу, содержащую полные и короткие названия генов из этого генома, идентификаторы белков, координаты и ориентацию генов в цепи: pmarina.tsv


© Сергей Маргасюк, 2015-2016