Банки нуклеотидных последовательностей.
1. Характеристика качества сборки генома Ancylostoma ceylanicum (nematodes).
С помощью NCBI Genome я выбрала нематоду Ancylostoma ceylanicum. Для этого организма на сайте NCBI находится только одна сборка, которую я и выбрала. Проэктов по секвенированию организма два, а образец один. Для сборки GCA_000688135.1 использовался образец SAMN02585415. Название этого образца: "Genome assembly sequence of Ancylostoma ceylanicum", что переводится как "Сборка геномной последовательности Ancylostoma ceylanicum". Также в описании есть Attributes (атрибуты): host (хозяин) Mesocricetus auratus; strain (штамм) HY135. Проект по секвенированию данного организма для данного образца имеет Accession: PRJNA231479 и ID: 231479. Этот проект был опубликован в Nature genetics под названием: "The genome and transcriptome of the zoonotic hookworm Ancylostoma ceylanicum identify infection-specific gene families.", что переводится как "Из генома и транскриптома, живущих в человеке, но способных жить в человеке, круглых червей Ancylostoma ceylanicum выявлена инфекционно-специфический семья генов."
Число скэффолдов сборки = 1,736. Число контигов сборки = 20,953. Подробные данные о контигах можно найти по ссылке Таблица контигов.
Количество | N50 | L50 | Самый длинный контиг | Самый короткий контиг | |
Контиг | 1,736 | 25,353 | 3,638 | JARK01001337(длина 4,802,298 пн) | JARK01001336(длина 509 пн) |
Ссылка на последовательность контига JARK01000952.
2. Описание ключей, используемых в таблицах особенностей.
Feature Key source
Идентифицирует биологический источник для указанного участка последовательности. Этот ключ является обязательным. Каждая запись должна иметь source охватывающий всю последовательность или несколько source keys, которые вместе охватывают всю последовательность.
Feature Key exon
Область генома, которая кодирует часть сплайсированных мРНК, рРНК и тРНК; может содержать 5'UTR (5' нетранслируемая область), все CDSs (кодирующая последовательность гена) и 3' UTR (3' нетранслируемая область).
Feature Key operon
Область, содержащая polycistronic transcript включая кластер генов, которые контролируются теми же регуляторными последовательностями/промоутерами и теми же биологическими реакциями.
Feature Key repeat_region
Область генома, содержащая повторяющиеся элементы.
Feature Key intron
Сегмент ДНК, который транскрибируется, но удаляется из транскрипта сплайсингом с последовательностью (экзонов) по обе стороны от нее.
Feature Key J_segment
Вариабельные сегменты имуноглобулина легких и тяжелых цепей, и Т-клеточных рецепторов альфа, бета, и гамма цепей. Только для эукариот.
Feature Key regulatory
Какой либо участок последовательности, функцией которого является регуляция транскрипции или трансляции.
Feature Key rep_origin
Ориджин репликация, начинающаяся с дубликации нуклеиновых кислот, которая дает две идентичные копии. Направление начинается с : RIGHT, LEFT, or BOTH.
Feature Key tRNA
Транспортная РНК, маленькая РНК молекула, которая опосредует трансляцию нуклеиновых кислот в аминокислотную последовательность.
Feature Key V_region
Вариабельный участок имуноглобулина легких и имуноглобулина легких и тяжелых цепей, и Т-клеточных рецепторов альфа, бета, и гамма цепей; кодируется для вариабельных амино терминальных участков; может состоять из of V_segments, D_segments, N_regions and J_segments. Для эукариот.
3. Описание массового геномного проекта.
The Rice 3000 Genomes Project Data.
3000 геномов риса - это международный проект в котором участвовали участники из институтов CAAS (Chinese Academy of Agricultural Sciences), BGI (Beijing Genomics Institute Shenzhen), IRRI (International Rice Research Institute) и другие. Цель создать базу геномов риса, открыть новые аллели важные для фенотипов риса. Мировое потребление риса увеличивается с каждым годом и эти данные могут помочь в усовершенствовании технологии разведения риса. Для этого они повторно секвенировали 3000 геномов риса, у секвенированных до этого геномов уровень охвата глубины секвенирования генома был низкий или выборка была небольшой, а это не давало полного представления о генетическом разнообразии риса.
Проект зарегестрирован 30 сентября 2014. Accession: PRJEB6180 ID: 262761
Последняя публикация была 28 мая 2014 Ссылка
4. Таблица митохондриальных генов Chondrus crispus таксона Rhodophyta.
Я составила запрос к Nucleotide, находящий все полные митохондриальные геномы таксона в GenBank и Refseq: "Rhodophyta"[Organism] AND mitochondrial[Title] AND complete[Title] AND (genome [All Fields] OR sequence[All Fields]). Число находок всего 684, в GenBank 488, в RefSeq 196.
Я выбрала представителя - Chondrus crispus. Ссылка на таблицу генов белков закодированных в митохондриальном геноме.
Ссылки:
© Кузнецова Ксения, 2015