Упражнение 1. Характеристика качества сборки генома эукариотического организма
Таблица 1. Информация о сборке генома
Название вида (русское) |
Леопард, или барс, или пантера |
Название вида (латинское) |
Panthera pardus |
Краткое описание |
Вид хищных млекопитающих семейства кошачьих, один из четырёх представителей рода пантера,
относящегося к подсемейству больших кошек.
В XX веке был внесён в Красную книгу МСОП,
в Красную книгу России, а также в охранные документы других стран. Однако во многих странах Африки
относительно высокая численность леопардов позволяет выделять ежегодно квоту на их добычу. |
Число сборок генома |
1 (GCA_001857705.1) |
Общая длина |
2,578,019,207 |
Число контигов сборки |
265,330 |
Число скэффолдов сборки |
50,377 |
Scaffold N50 |
21,701,857 |
Scaffold L50 |
39 |
Contig N50 |
20,993 |
Contig L50 |
34,315 |
Число аннотированных белков |
58,182 |
Ссылка не публикацию с описанием проекта:
Mitogenomic analysis of the genus Panthera
Ссылка на последовательность 10-го контига в RefSeq:
Panthera pardus isolate Maewha scaffold1_contig10, whole genome shotgun sequence
Упражнение 2. Ключи (Feature Keys) таблиц особенностей (FT или Feature table) с сайта INSDC
Название: CDS
Описание: Кодирующий белок участок последовательности
Пример:
3704..4659
/gene="ND1"
/note="TAA stop codon is completed by the addition of 3' A
residues to the mRNA"
/codon_start=1
/transl_except=(pos:4658..4659,aa:TERM)
/transl_table=2
/product="NADH dehydrogenase subunit 1"
/protein_id="ABP73296.1"
/translation="MFMINILSLIVPILLAVAFLTLVERKVLGYMQLRKGPNVVGPYG
LLQPIADAMKLFTKEPLRPLTSSMFMFIMAPILALTLALTMWIPLPMPYPLINMNLGV
LFMLAMSSLAVYSILWSGWASNSKYALIGALRAVAQTISYEVTLAIILLSVLLMNGSF
TLATLITTQEYIWLIIPAWPLAMMWFISTLAETNRAPFDLTEGESELVSGFNVEYAAG
PFALFFLAEYANIIMMNILTTILFFGAFHSPYMPELYTTNFTVKTLILTTTFLWIRAS
YPRFRYDQLMHLLWKSFLPLTLALCMWHVSLPIITASIPPQT"
Название: tRNA
Описание: Зрелая транспортная РНК; небольшая молекула РНК, определяющая трансляцию последовательности нуклеиновых кислот в аминокислотную последовательность
Пример:
3625..3701
/product="tRNA-Leu"
/note="codons recognized: UUR"
Название: rRNA
Описание: Зрелая рибосомальная РНК; РНК-компонента рибонуклеопротеина (рибосома), которая собирает аминокислоты в белки.
Пример:
2053..3624
/product="16S ribosomal RNA"
Название: misc_feature
Описание: Сайт в нуклеиновой кислоте, ковалентно или нековалентно
связанный с другим участком этой же структуры, который не может быть описан другими ключами (primer_bind или protein_bind)
Пример:
join(16404..16964,1..954)
/note="control region; CR"
Название: gene
Описание: Участок биологического интереса, определенный как ген, с присвоенным ему именем
Пример:
3704..4659
/gene="ND1"
Название: assembly_gap
Описание: Гэп между двумя компонентами генома или транскриптома сборки
Пример:
3271..3464
/standard_name="RH136367"
/db_xref="UniSTS:210357"
Название: source
Пример:
joi1..16964
/organism="Panthera pardus"
/organelle="mitochondrion"
/mol_type="genomic DNA"
/db_xref="taxon:9691"
Упражнение 3. Состояние дел в одном из массовых геномных проектов
Таблица 2. Информация о проекте
Название проекта |
100,000 Genomes Project |
Цель |
Упорядочивание геномов людей с записью их истории болезней, с целью быстрой диагностики заболеваний |
Год начала |
2012 |
Организация |
Government of the United Kingdom |
Страна |
UK |
Планируемое число геномов |
100,000 |
Планируемый год завершения |
Неизвестен |
Количество секвенированных геномов на 2018 год |
87,231 |
Страница проекта
PubMed
Упражнение 4. Таблица митохондриальных генов Nematoda
Текст запроса: tax_tree(42155) AND mol_type="genomic DNA" AND topology="CIRCULAR" AND organelle="mitochondrion"
Release: 1
Update: 0
Выбранный организм: Brugia timori
AC: AP017686.1
Ссылка на запись Brugia timori в ENA
Таблица генов белков
© Бруман Софья, 2018