Банки нуклеотидных последовательностей

Упражнение 1. Характеристика качества сборки генома эукариотического организма

Рис.1. Vulpes vulpes

Название вида (русское) Лисица, лиса, обыкновенная или рыжая лисица
Название вида (латинское) Vulpes vulpes
Краткое описание Хищное млекопитающее семейства псовых, наиболее распространённый и самый крупный вид рода лисиц. Длина тела 60—90 см, хвоста — 40—60 см, масса — 6—10 кг.
Число сборок генома 1 (GCA_003160815.1)
Общая длина 2,421,568,072
Число контигов сборки 183,898
Число скэффолдов сборки 82,424
Scaffold N50 12,472,085
Scaffold L50 55
Contig N50 55,45
Contig L50 12,033
Число аннотированных белков 37,962

Табл.1. Информация о сборке генома


Ссылка на публикацию с описанием проекта
Ссылка на последовательность одного из контигов в RefSeq (GenBank: NBDQ01000003.1)

Упражнение 2. Ключи (Feature Keys) таблиц особенностей (FT или Feature table) с сайта INSDC


Ключ: название (англ.) Ключ: описание (рус.) Пример из записи
CDS Не содержащая стоп кодонов белок-кодирующая последовательность, содержащая информацию об аминокислотной последовательности пептидного или белкового продукта с последующими посттрансляционными модификациями. CDS
< 1..510
/note="ORF 1"
/pseudo
/codon_start=1
/product="gp85/sialidase homologue"
https://www.ncbi.nlm.nih.gov/nuccore/M91469.1
gene Имеющий название и представляющий интерес для изучения участок последовательности ДНК. gene 194..1123
/locus_tag="SNL152K_6703"
https://www.ncbi.nlm.nih.gov/nuccore/BHXA01000104.1
exon Участок генома, кодирующий сплайсирующийся участок mRNA, rRNA или tRNA; может содержать 5' некодирующие области, белок-кодирующие последовательности и 3' некодирующие области. exon 2357..2438
/gene="LOC100381762"
/inference="alignment:Splign:2.1.0"
/pseudo https://www.ncbi.nlm.nih.gov/nuccore/NR_159423.1
ncRNA Не кодирующий белок ген, рРНК или тРНК, транскрибирующийся в функционирующую РНК последовательность. ncRNA complement(48289..48467)
/ncRNA_class="other"
/gene="ssrS"
/locus_tag="DQH42_RS07540"
/product="6S RNA"
/inference="COORDINATES: nucleotide
motif:Rfam:12.0:RF00013"
/inference="COORDINATES: profile:INFERNAL:1.1.1"
/note="Derived by automated computational analysis using
gene prediction method: cmsearch."
/db_xref="RFAM:RF00013"
https://www.ncbi.nlm.nih.gov/nuccore/NZ_RAAR01000040.1
rRNA Зрелая рибосомальная РНК; РНК-компонента рибонуклеопротеина (рибосома), которая собирает аминокислоты в белки. rRNA 169..1713
/locus_tag="C7543_RS16420"
/old_locus_tag="C7543_3285"
/product="16S ribosomal RNA"
https://www.ncbi.nlm.nih.gov/nuccore/NZ_RBIB01000009.1
tRNA Зрелая транспортная РНК; небольшая молекула РНК, определяющая трансляцию последовательности нуклеиновых кислот в аминокислотную последовательность tRNA 1806..1881
/locus_tag="C7543_RS16425"
/old_locus_tag="C7543_3286"
/product="tRNA-Ala"
/inference="COORDINATES: profile:tRNAscan-SE:1.23"
/anticodon=(pos:1839..1841,aa:Ala,seq:tgc)
https://www.ncbi.nlm.nih.gov/nuccore/NZ_RBIB01000009.1
centromere Участок, идентифицированный, как центромер centromere <1..>447
https://www.ncbi.nlm.nih.gov/nuccore/MG708499.1

Табл.2. Ключи, использующиеся в поле "особенности" баз данных


Упражнение 3. Состояние дел в одном из массовых геномных проектов

Название проекта The 100.000 Genomes Project
Цель Секвенирование 100.000 геномов людей с редкими заболеваниями, членов их семей и пациентов, больных раком.
Год начала 2012
Организация Department of Health & Social Care
Страна UK
Планируемый год завершения -
Количество секвенированных геномов на 2018 год 87.231

Табл.3. Состояние дел в The 100.000 Genomes Project на 2018 год


PubMed
Страница проекта

Упражнение 4. Таблица митохондриальных генов Ciliaphora

Рис.2. Paramecium caudatum

Запрос "Paramecium caudatum"[Organism] AND ("Complete genome"[Title] OR "Complete sequence"[Title]) AND "Mitochondrion"[Title] AND "RefSeq"[Keyword]
Число находок 1
АС выбранной записи NC_014262.1
Число п. н. в митохондриальном геноме 43660
Название Инфузория-туфелька (лат. Paramecium caudatum)

Табл.4. Таблица митохондриальных генов Ciliaphora


Страница на NCBI
Таблица генов белков

© Макиевская Кьяра, 2018