Банки нуклеотидных последовательностей

Задание 1.

Выбранный организм: Canis lupus familiaris (dog).

Рис.1 - Canis lupus familiaris (dog)

Таблица 1. Характеристика качества сборки генома эукариотического организма

Параметр Значение
Число сборок генома 3
Число проектов по секвенированию организма 4
Число образцов 3
Характеристика одного из образцов (с наибольшим показателем по Level)
BioSample ID 2953603
Описание образца Биообразец: SAMN02953603;
GenBank: gb|AAEX00000000.3;
Организм: Canis lupus familiaris (собака); Пол: женский; Подвид: familiaris; Порода: боксер;
BioProjects (Биопроекты):
1) PRJNA13179 Canis lupus familiaris;
2) PRJNA12384 Canis lupus familiaris.
Описание проекта Проект: PRJNA13179;
Тип данных: Секвенирование и сборка генома;
Охват проекта: Monoisolate;
Публикации:
1) Lindblad-Toh K et al., "Genome sequence, comparative analysis and haplotype structure of the domestic dog.", Nature, 2005 Dec 8;438(7069):803-19;
2) Kim KS et al., "The complete nucleotide sequence of the domestic dog (Canis familiaris) mitochondrial genome.", Mol Phylogenet Evol, 1998 Oct;10(2):210-20;
Организм: Canis lupus familiaris[Taxonomy ID: 9615];
Представление: дата регистрации - 10-Nov-2004;
Префикс локусного тэга: AGS45.
Число контигов/скэффолдов данной сборки 27106/3310
N50 и L50, самый длинный и самый короткий контиг N50: контиг - 267478, скэффолд - 45876610;
L50 : контиг - 2436, скэффолд - 20;
Самый длинный контиг: 2428071;
Самый короткий контиг: 136.

Ссылка на таблицу контигов/скэффолдов
Ссылка на последовательность одного из контигов

Задание 2.

В данном задании необходимо было описать 10 ключей, используемых в таблицах особенностей. Данные были взяты с сайта INSDC.

Таблица 1. Описание ключей

Ключ Описание ключа Пример
repeat_region Находит повторяющиеся элементы генома. repeat_region 80..401
/rpt_type=DISPERSED
/rpt_family="Alu-J"
V_segment Вариабельный сегмент легких и тяжелых цепей иммуноглобулина и T-клеточного рецептора альфа, бетта и гамма цепей; он кодирует большую часть вариабельного участка и последние несколько аминокислот лидирующего пептида. V_segment <14..>16
/note="V segment"
C-region Константный участок легких и тяжелых цепей иммуноглобулина и T-клеточного рецептора альфа, бетта и гамма цепей; включает в себя 1 и более экзонов, в зависимости от конкретной цепи. C_region complement(join(277376..277837,279083..279226))
/gene="LOC108926671"
/standard_name="Ig lambda chain C region-like"
/note="Derived by automated computational analysis using gene prediction method: Gnomon. Supporting evidence includes similarity to: 17 Proteins, and 100% coverage of the annotated genomic feature by RNAseq alignments, including 6 samples with support for all annotated introns"
/db_xref="GeneID:108926671"
variation Штамм содержит "стабильную" мутацию одного и того же гена (полиморфизм и т.д.), которая отличает представленную пследовательность в данной позиции. variation 1168
/frequency="0.125"
/replace="c"
3'UTR 1) Участок 3' конца РНК вируса, который не транслируется в белок;
2) Участок 3'конца зрелого транскрипта, который не транслируется в белок.
3'UTR 6273..6431
/gene="3'UTR"
/locus_tag="NZ87_gp6"
5'UTR 1) Участок 5' конца РНК вирусного генома, который не транслируется в белок;
2) Участок 5' конца зрелого транскрипта, который не транслируется в белок.
5'UTR <1..>227
/gene="5'UTR"
sig_peptide Сигнальный пептид кодирующей последовательности; кодирует последовательность для N-терминального домена секретируемого белка. sig_peptide 30..92
/gene="IL10RB"
/gene_synonym="IL10R2"
/inference="COORDINATES: ab initio prediction:SignalP:3.0"
tRNA Зрелая транспортная РНК. tRNA 1..90
/product="tRNA-Ser"
/note="Ser-tRNA-2; codon recognized: TCA; aa: Ser"
protein_bind Не-ковалентный белковый сайт связывания нуклеиновых кислот. protein_bind 416..424
/gene="ELP"
/experiment="experimental evidence, no additional details recorded"
/bound_moiety="ELP"
telomere Участок биологического интереса, идентифицированный как теломера, который был эксперементально охарактеризован. telomere complement(1..7223)
/note="TEL16L; Telomeric region on the left arm of
Chromosome XVI; annotated components include an X element
core sequence, X element combinatorial repeats, and a long
Y' element; TEL16L does have telomeric repeats
(TEL16L-TR), but they are missing from the genome
annotation due to difficulties encountered during
sequencing and/or assembly"
/db_xref="SGD:S000028933"

Задание 3.

Название проекта: The 100.000 Genomes Project;
Цель: создать геномный медицинский сервис для NHS; задать начало развитию геномной индустрии СК.
Год начала: 2012;
Год завершения: 2017;
Планируемое число геномов: 100.000;
Организация: Genomics England, спонсируемая Департаментом Здоровья;
Страна: Великобритания;
Сколько геномов секвенировано на 2016 год: 13971;
Краткое описание: Данный проект сфокусирован на пациентах с редкими заболеваниями и их семьях, а также пациентах с раком. Это - один из крупнейших национальных проектов по секвенированию такого рода в мире. Одна из главных целей - создание нового геномного медицинского сервиса для NHS - изменить способ оказания помощи людям. Пациентам может быть предложена диагностика, не существовавшая ранее. Исследователи будут изучать, как лучше применять геномику в здравоохранении и как интерпретировать данные для помощи пациентам.
Ссылка на страницу
Последняя публикация по проекту (ссылка на pubmed)

Задание 4.

В данном задании необходимо было составить таблицу митохондриальных генов одного из организмов указаного таксона. Заданный мне таксон: Heterolobosea. В качестве представителя таксона была взята: Naegleria fowleri (неглерия Фоулера).

Рис.2 - Изображение Naegleria fowleri

Поиск по полям в БД Nucleotide (NCBI): GenBank - complete[TI] AND Heterolobosea[ORGN] AND gene_in_mitochondrion[PROP] AND GenBank[filter], число находок: 7; Refseq - complete[TI] AND Heterolobosea[ORGN] AND gene_in_mitochondrion[PROP] AND RefSeq[filter], число находок: 4. "Общий" поиск: complete[TI] AND Heterolobosea[ORGN] AND gene_in_mitochondrion[PROP].
Ссылка на таблицу генов белков закодированных в митохондриальном геноме


© Kalashnikova Anastasia, 2016