Нуклеотидные банки данных

Отчет

1. Охарактеризуйте качество сборки генома эукариотического организма

Организм - Caenorhabditis elegans, использован поиск по БД Genome

Caenorhabditis_elegans – свободноживущая почвенная нематода, примерно 1мм величиной,

первый полностью секвенированный многоклеточный организм.

Вот этот червь картинка загружается...

Число сборок генома: 2

Информация о сборках генома

Выбрана GCA_000975215.1  поскольку для нее есть WGS
Число проектов по секвенированию: 11   
Для сборки GCA_000975215.1 :
        Описание образца

BIOSAMPLE ID: SAMN03334911
Sample name: Caenorhabditis elegans Hawaiian Strain CB4856 
Краткое описание:
Взяты с ананасового поля на Гавайах, диплоидны, размножаются половым образом.

        Описание проекта 
Caenorhabditis elegans Hawaiian Strain CB4856 Genome Assembly
BIOPROJECT ID:  PRJNA275000
 Информация о bioproject 
CB4856 – один из самых изучаемых и перспективных штаммов  C. elegans, 
был получен Линдой Холден в 1972 году на ананасовом поле на острове Маю в Гавайах.
Он показывает различные фенотипические отличия, включающие социальное поведение(собираются в кучки), 
независимость размеров от температуры, устойчивость к антибиотикам.

Для выбранной сборки 16 контигов и скеффолдов тоже 16 (одни и те же участки). 
 Таблица контигов 

JZEW01000001 –  самый длинный контиг , длина 14,890,789

JZEW01000015 – самый короткий контиг , длина 607

2. Составьте таблицу митохондриальных генов указанного мха

Мой мох - Racomitrium ericoides

картинка загружается...

Запрос, результатом которого является только нужный геном: "Racomitrium ericoides"[Organism] AND mitochondrion[filter] Отсюда можно придти сюда: Рнк - 39, белков- 3 рибосомальных и 24 транспортных. Ссылка на таблицу с кол-вом рнк и белков Ссылка на файл со списком генов, отсортированным по началу в геноме Была использована функция sort by chromosome вверху в меню. картинка загружается...

3. Опишите десять ключей, используемых в таблицах особенностей

Страница help'а INSDC.
 Основные ключи:
1) Source ключ
Собственно данные об организме.
source          1..106727
                     /organism="Racomitrium ericoides"
                     /organelle="mitochondrion"
                     /mol_type="genomic DNA"
                     /db_xref="taxon:657341"
2) Gene ключ
Локализация гена, его идентификатор и др. информация
gene            254..327
                     /gene="trnI (CAU)"
                     /locus_tag="UO55_t01"
                     /db_xref="GeneID:23857625"
3) tRNA ключ
tRNA            254..327
                     /gene="trnI (CAU)" # ген
                     /locus_tag="UO55_t01" # локус
                     /product="tRNA-Ile" # продукт
                     /exception="RNA editing"
                     /note="C in the first position of the anticodon assumed to
                     be post-transcriptionally modified to lysidine, which
                     pairs with A rather than G; tRNA with a methionine
                     anticodon post-transcriptionally modified to have tRNA-Ile
                     activity"
                     /db_xref="GeneID:23857625"
4)  CDS – coding sequence ключ
 CDS             complement(join(2045..2549,4297..4628,7259..7366,
                     7758..7870,9505..10015))
                     /gene="cox1"
                     /locus_tag="UO55_p39"
                     /codon_start=1
                     /product="cytochrome c oxidase subunit 1"
                     /protein_id="YP_009122527.1"
                     /db_xref="GI:788229054"
                     /db_xref="GeneID:23629912"
                     /translation="MNNFAQRWLFSTNHKDIGTLYCIFGAIAGVMGTCFSVLIRMELA
                     QPGNQILGGNHQLYNVLITAHAFLMIFFMVMPAMIGGFGNWFVPILIGAPDMAFPRLN
                     NISFWLLPPSLLLLLSSALVEVGAGTGWTVYPPLSGITSHSGGSVDLAIFSLHLSGVS
                     SILGSINFITTIFNMRGPGMTMHRLPLFVWSVLVTAFLLLLSLPVLAGAITMLLTDRN
                     FNTTFFDPAGGGDPILYQHLFWFFGHPEVYILISPGFGIISHIVSTFSRKPVFGYLGM
                     VYALISIGVLGFIVWAHHMFTVGLDVDTRAYFTAATMIIAVPTGIKIFSWIATMWGGS
                     IQYKTPMLFAVGFIFLFTVGGLTGIVLANSGLDIALHDTYYVVAHFHYVLSMGAVFAL
                     FAGFYYWIGKITGLQYPETLGQIHFWITFFGVNLTFFPMHFLGLAGMPRRIPDYPDAY
                     AGWNAFSSFGSYVSVIGIFCFFVVVFLTLTSENKCAPSPWAVEQNSTTLEWMVKSPPA
                     FHTFSELPVIKESI" 
5) exon            complement(2045..2549)
                     /gene="cox1"
                     /locus_tag="UO55_p39"
                     /number=5

6)
   intron          complement(2550..4296)

                     /gene="cox1"
                     /locus_tag="UO55_p39"
7) rRNA            35204..38588
                     /gene="rrn26"
                     /locus_tag="UO55_r01"
                     /product="26S ribosomal RNA"
                     /db_xref="GeneID:23857645"
8)Далее ключи были взяты из https://www.ncbi.nlm.nih.gov/nuccore/Z86099.2 для генома вируса герпеса
misc_feature – это Miscellaneous feature(miscellaneous – разрозненный, различный)
 misc_feature    255
                     /note="start of TRL (terminal copy of Long Repeat region)"
9) Для повторов: 
repeat_region   446..460
                     /gene="RL1"
                     /rpt_family="7"

10) Для регуляторных элементов: 
regulatory      1738..1743
                     /regulatory_class="polyA_signal_sequence"

Спасибо!:)
PS : Задание 4 разобрано в следующем практикуме.