Банки нуклеотидных последовательностей.

1. Характеристика качества сборки генома Ancylostoma ceylanicum (nematodes).

С помощью NCBI Genome я выбрала нематоду Ancylostoma ceylanicum. Для этого организма на сайте NCBI находится только одна сборка, которую я и выбрала. Проэктов по секвенированию организма два, а образец один. Для сборки GCA_000688135.1 использовался образец SAMN02585415. Название этого образца: "Genome assembly sequence of Ancylostoma ceylanicum", что переводится как "Сборка геномной последовательности Ancylostoma ceylanicum". Также в описании есть Attributes (атрибуты): host (хозяин) Mesocricetus auratus; strain (штамм) HY135. Проект по секвенированию данного организма для данного образца имеет Accession: PRJNA231479 и ID: 231479. Этот проект был опубликован в Nature genetics под названием: "The genome and transcriptome of the zoonotic hookworm Ancylostoma ceylanicum identify infection-specific gene families.", что переводится как "Из генома и транскриптома, живущих в человеке, но способных жить в человеке, круглых червей Ancylostoma ceylanicum выявлена инфекционно-специфический семья генов."

Число скэффолдов сборки = 1,736. Число контигов сборки = 20,953. Подробные данные о контигах можно найти по ссылке Таблица контигов.

Таблица параметры контигов
Количество N50 L50 Самый длинный контигСамый короткий контиг
Контиг 1,736 25,353 3,638 JARK01001337(длина 4,802,298 пн) JARK01001336(длина 509 пн)

Ссылка на последовательность контига JARK01000952.

2. Описание ключей, используемых в таблицах особенностей.

Feature Key source

Идентифицирует биологический источник для указанного участка последовательности. Этот ключ является обязательным. Каждая запись должна иметь source охватывающий всю последовательность или несколько source keys, которые вместе охватывают всю последовательность.

Feature Key exon

Область генома, которая кодирует часть сплайсированных мРНК, рРНК и тРНК; может содержать 5'UTR (5' нетранслируемая область), все CDSs (кодирующая последовательность гена) и 3' UTR (3' нетранслируемая область).

Feature Key operon

Область, содержащая polycistronic transcript включая кластер генов, которые контролируются теми же регуляторными последовательностями/промоутерами и теми же биологическими реакциями.

Feature Key repeat_region

Область генома, содержащая повторяющиеся элементы.

Feature Key intron

Сегмент ДНК, который транскрибируется, но удаляется из транскрипта сплайсингом с последовательностью (экзонов) по обе стороны от нее.

Feature Key J_segment

Вариабельные сегменты имуноглобулина легких и тяжелых цепей, и Т-клеточных рецепторов альфа, бета, и гамма цепей. Только для эукариот.

Feature Key regulatory

Какой либо участок последовательности, функцией которого является регуляция транскрипции или трансляции.

Feature Key rep_origin

Ориджин репликация, начинающаяся с дубликации нуклеиновых кислот, которая дает две идентичные копии. Направление начинается с : RIGHT, LEFT, or BOTH.

Feature Key tRNA

Транспортная РНК, маленькая РНК молекула, которая опосредует трансляцию нуклеиновых кислот в аминокислотную последовательность.

Feature Key V_region

Вариабельный участок имуноглобулина легких и имуноглобулина легких и тяжелых цепей, и Т-клеточных рецепторов альфа, бета, и гамма цепей; кодируется для вариабельных амино терминальных участков; может состоять из of V_segments, D_segments, N_regions and J_segments. Для эукариот.

3. Описание массового геномного проекта.

The Rice 3000 Genomes Project Data.

3000 геномов риса - это международный проект в котором участвовали участники из институтов CAAS (Chinese Academy of Agricultural Sciences), BGI (Beijing Genomics Institute Shenzhen), IRRI (International Rice Research Institute) и другие. Цель создать базу геномов риса, открыть новые аллели важные для фенотипов риса. Мировое потребление риса увеличивается с каждым годом и эти данные могут помочь в усовершенствовании технологии разведения риса. Для этого они повторно секвенировали 3000 геномов риса, у секвенированных до этого геномов уровень охвата глубины секвенирования генома был низкий или выборка была небольшой, а это не давало полного представления о генетическом разнообразии риса.

Проект зарегестрирован 30 сентября 2014. Accession: PRJEB6180 ID: 262761

Последняя публикация была 28 мая 2014 Ссылка

4. Таблица митохондриальных генов Chondrus crispus таксона Rhodophyta.

Я составила запрос к Nucleotide, находящий все полные митохондриальные геномы таксона в GenBank и Refseq: "Rhodophyta"[Organism] AND mitochondrial[Title] AND complete[Title] AND (genome [All Fields] OR sequence[All Fields]). Число находок всего 684, в GenBank 488, в RefSeq 196.

Я выбрала представителя - Chondrus crispus. Ссылка на таблицу генов белков закодированных в митохондриальном геноме.

Ссылки:

На страницу 3 семестра

На главную


© Кузнецова Ксения, 2015