Банки нуклеотидных последовательностей

Упражнение 1. Характеристика качества сборки генома эукариотического организма



Таблица 1. Информация о сборке генома

Название вида (русское) Леопард, или барс, или пантера
Название вида (латинское) Panthera pardus
Краткое описание Вид хищных млекопитающих семейства кошачьих, один из четырёх представителей рода пантера, относящегося к подсемейству больших кошек.
В XX веке был внесён в Красную книгу МСОП, в Красную книгу России, а также в охранные документы других стран. Однако во многих странах Африки относительно высокая численность леопардов позволяет выделять ежегодно квоту на их добычу.
Число сборок генома 1 (GCA_001857705.1)
Общая длина 2,578,019,207
Число контигов сборки 265,330
Число скэффолдов сборки 50,377
Scaffold N50 21,701,857
Scaffold L50 39
Contig N50 20,993
Contig L50 34,315
Число аннотированных белков 58,182


Ссылка не публикацию с описанием проекта:

Mitogenomic analysis of the genus Panthera

Ссылка на последовательность 10-го контига в RefSeq:

Panthera pardus isolate Maewha scaffold1_contig10, whole genome shotgun sequence


Упражнение 2. Ключи (Feature Keys) таблиц особенностей (FT или Feature table) с сайта INSDC

Название: CDS
Описание: Кодирующий белок участок последовательности
Пример:
3704..4659
/gene="ND1"
/note="TAA stop codon is completed by the addition of 3' A residues to the mRNA"
/codon_start=1
/transl_except=(pos:4658..4659,aa:TERM)
/transl_table=2
/product="NADH dehydrogenase subunit 1"
/protein_id="ABP73296.1"
/translation="MFMINILSLIVPILLAVAFLTLVERKVLGYMQLRKGPNVVGPYG
LLQPIADAMKLFTKEPLRPLTSSMFMFIMAPILALTLALTMWIPLPMPYPLINMNLGV
LFMLAMSSLAVYSILWSGWASNSKYALIGALRAVAQTISYEVTLAIILLSVLLMNGSF
TLATLITTQEYIWLIIPAWPLAMMWFISTLAETNRAPFDLTEGESELVSGFNVEYAAG
PFALFFLAEYANIIMMNILTTILFFGAFHSPYMPELYTTNFTVKTLILTTTFLWIRAS
YPRFRYDQLMHLLWKSFLPLTLALCMWHVSLPIITASIPPQT"

Название: tRNA
Описание: Зрелая транспортная РНК; небольшая молекула РНК, определяющая трансляцию последовательности нуклеиновых кислот в аминокислотную последовательность
Пример:
3625..3701
/product="tRNA-Leu"
/note="codons recognized: UUR"

Название: rRNA
Описание: Зрелая рибосомальная РНК; РНК-компонента рибонуклеопротеина (рибосома), которая собирает аминокислоты в белки.
Пример:
2053..3624
/product="16S ribosomal RNA"

Название: misc_feature
Описание: Сайт в нуклеиновой кислоте, ковалентно или нековалентно связанный с другим участком этой же структуры, который не может быть описан другими ключами (primer_bind или protein_bind)
Пример:
join(16404..16964,1..954)
/note="control region; CR"

Название: gene
Описание: Участок биологического интереса, определенный как ген, с присвоенным ему именем
Пример:
3704..4659
/gene="ND1"

Название: assembly_gap
Описание: Гэп между двумя компонентами генома или транскриптома сборки
Пример:
3271..3464
/standard_name="RH136367"
/db_xref="UniSTS:210357"

Название: source
Пример:
joi1..16964
/organism="Panthera pardus"
/organelle="mitochondrion"
/mol_type="genomic DNA"
/db_xref="taxon:9691"

Упражнение 3. Состояние дел в одном из массовых геномных проектов

Таблица 2. Информация о проекте

Название проекта 100,000 Genomes Project
Цель Упорядочивание геномов людей с записью их истории болезней, с целью быстрой диагностики заболеваний
Год начала 2012
Организация Government of the United Kingdom
Страна UK
Планируемое число геномов 100,000
Планируемый год завершения Неизвестен
Количество секвенированных геномов на 2018 год 87,231

Страница проекта

PubMed



Упражнение 4. Таблица митохондриальных генов Nematoda

Текст запроса: tax_tree(42155) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Release: 1
Update: 0
Выбранный организм: Brugia timori
AC: AP017686.1

Ссылка на запись Brugia timori в ENA

Таблица генов белков


© Бруман Софья, 2018