Банки нуклеотидных последовательностей

Характеристика качества сборки генома Echinococcus granulosus

Выбранный мной организм, эхинококк Echinococcus granulosus, принадлежит к классу ленточные черви. Червь является паразитом: заражение личинками приводит к опасному зоонозному гельминтозу под названием эхинококкоз, при котором человек или травоядное животное выступает в роли промежуточного хозяина. E. granulosus впервые обнаружен на Аляске, но распространен он повсеместно. Окончательными хозяевами выступают плотоядные хищники, чаще всего представители семейства псовых (собаки, лисы, волки, медведи), а также кошачьи (домашние кошки, львы). Взрослый эхинококк живет в их тонкой кишке и производит яйца, чтобы они выводились из организма вместе с калом. Промежуточные хозяева заражаются при заглатывании яиц. Дикие и домашние травоядные животные (крупный рогатый скот, козы, овцы, свиньи, верблюды), а также грызуны являются обычными промежуточными хозяевами. Люди также могут быть заражены и сыграть роль промежуточного хозяина для эхинококка.[1]


Женская особь Echinococcus granulosus

На сайте NCBI поиск по названию организма дал только одну сборку GCA_000524195.1. Проект по секвенированию всего один (PRJNA182977) с единственным же образцом SAMN01914755 (Sample name: EST of Echinococcus granulosus; SRA: SRS390939). Секвенирование было осуществлено Chinese National Human Genome Center в Шанхае в медицинских целях, результаты были опубликованы 27-ФEB-2013 в работе The genome of the hydatid tapeworm Echinococcus granulosus (Nat Genet, 2013;45(10):1168-1175), что переводится как "Геном гидатидного ленточного червя Echinococcus granulosus".

Таблица характеристик сборки

Характеристика Длина (в п.н.)
Общая длина последовательности 110 837 706
Общая длина гэпов сборки 730 700
Число контигов 8 264
Contig N50 42 483
Самый короткий контиг 1 003 (APAU02000957)
Самый большой контиг 3 893 204 ( APAU02000001)
Contig L50 660
Число скаффолдов 957
Scaffold N50 712 683
Общее число хромосом и плазмид 0
Таблица контигов ссылка
Последовальность одного из контигов на выбор APAU02000251


Описание ключей, используемых в таблицах особенностей (Feature Key или Feature table)

Главная цель создания Feature table - обеспечить обшиный набор обозначений для описания особенностей структуры и для даньнейшего ее эффективного изменения. Язык Feature Table олицетворяет собой правила, позволяющие трем базам (GenBank, EMBL, и DDBJ) данных постоянно обмениваться информацией.

Пример: изображенное может читаться как "CDS - кодирующая последовательность, начинающаяся с нуклеотида 23 и заканчивающаяся на 400, имеющая продукт "алкогольдигидрогеназа" и кодируемая геном "adhI""

Десять ключей, используемых в таблицах особенностей

exon

Участок генома, кодирующий вырезаемую часть мРНК, рРНК и тРНК; может содержать 5’UTR, CDS и 3’UTR

tRNA

Транспортная РНК

CDS

От coding DNA sequence – участок днк/рнк, состоящий из экзонов, кодирующих белок от старт-кодона до стоп-кодона включительно.

source

Определяет биологический источник участка генетического материала определённой длины; Ключ является обязательным; Разрешено указывать этот ключ более одного раза на одну последовательность; Каждая запись должна иметь как минимум один такой ключ, охватывающий всю последовательность, или несколько ключей, которые вместе охватывают всю последовательность.

gene

Ключ описывает интервал ДНК, соответствующий генетическому признаку или фенотипу (границы интервала нестрогие)

mRNA

мРНК; участок включает в себя 5’-нетранслируемый конец (5’UTR), кодирующую последовательность (CDS, exon) и 3’-нетранслируемый конец (3’UTR)

misk_RNA

Любой транскрипт, который не может быть определен другими РНК-ключами (prim_transcript, precursor_RNA, mRNA, 5'UTR, 3'UTR, exon, CDS, sig_peptide, transit_peptide, mat_peptide, intron, polyA_site, ncRNA, rRNA and tRNA).

precursor_RNA

Любой вид РНК, который еще не прош.ел процессинг.

Repeat_region

Область генома, содержащая повторяющиеся элементы.

nc_RNA

Некодирующий белок ген, отличающийся от рРНК и мРНК, на котором синтезируется РНК-транскрипт.


Массовый проект 100,000 человеческих геномов.

Название: The 100,000 Genomes Project (Проект 100,000 геномов)
Страна: Великобритания
Организация: Genomics England
Цели: Индивидуализировать медицину, лучше изучить природу рака и многих генетических заболеваний, упростить и удешевить их диагностирование, подстегнуть развитие геномики Британии, просветительская деятельность.
Год запуска: 2012
На данный момент: Отсеквенированно 19,072 геномов (состояние на 6 февраля).
Сайт проекта: https://www.genomicsengland.co.uk/the-100000-genomes-project/
Последняя публикация: The 100 000 Genomes Project: What it means for paediatrics (9 декабря 2016)

Таблица митохондриальных генов

Данный таксон: Heterolobosea

Требовалось составить таблицу митохондриальных генов для организма из данного таксона. Чтобы найти все полные митохондриальные геномы, в БД NCBI (Nucleotide) был выполнен следующий поисковой запрос: (((Heterolobosea[Organism]) AND complete[Title]) AND mitochondrion[Title]) AND genome[All Fields].

Найдено 9 результатов, из них 5 - GenBank, 4 - RefSeq.

Выбранный мною организм - Неглерия Фоулера (лат. Naegleria fowleri) — вид одноклеточных эукариотических организмов из семейства Vahlkampfiidae (Класс Heterolobosea).Представители обитают в естественных и искусственных пресных водоёмах при температуре 25—30 °C. Факультативный паразит человека, поражающий нервную систему, вызывающий первичный амёбный менингоэнцефалит. Заражение происходит во время купания или при контакте с грязной водой. Паразит попадает через нос в обонятельный нерв и пробирается по нему в головной мозг человека.[2]


Naegleria fowleri

Для получения списка митохондриальных генов была осуществлены следующие шаги: ссылка gene (в разделе Related information -> Sort by Chromosome). Всего было найдено 69 генов, из них только 47 кодируют белки (Categories - Protein-coding). Таблица с характеристиками кодирующих белки генов доступна по ссылке.

[1]. Echinococcus granulosus on Wikipedia
[2]. Неглерия Фоулера на Wikipedia

Назад
На главную



© Кучеренко Варвара 2015