Главная страница
term3 🕒

Нуклеотидные банки данных

TASK1. Характеристика качества сборки генома обыкновенной косатки

название вида Orcinus orca (Обыкновенная косатка)
число сборок генома 1
общая длина 2,372,919,875
число контигов сборки 80,100
число скэффолдов сборки 1,668
Scaffold N50 12,735,091
Scaffold L50 60
Contig N50 70,300
Contig L50 9,480
число аннотированных белков 27870
ссылка не публикацию с описанием проекта перейти по ссылке
ссылка на последовательность первого контига в RefSeq перейти по ссылке

1.killerwhales

TASK2. Описание семи ключей, используемых в таблицах особенностей

номер ключ значение пример
1 CDS кодирующий участок последовательности
     CDS             4870..5911
                     /gene="ND2"
                     /note="TAA stop codon is completed by the addition of 3' A
                     residues to the mRNA"
                     /codon_start=1
                     /transl_except=(pos:5911,aa:TERM)
                     /transl_table=2
                     /product="NADH dehydrogenase subunit 2"
                     /protein_id="YP_001874841.1"
                     /db_xref="GeneID:6262376"
                     /translation="MKPPIFITIMLTVISGTMIVMTTSHWLMVWIGFEMNLLAVIPIL
                     MKKYNPRATEAATKYFLTQATASMLLMMGIIINLLHSGQWTVSKDLNPMASIMMTIAL
                     AMKLGLAPFHFWVPEVTQGISMSSGLILLTWQKIAPLSILYQISPTINPSLLLTMAIM
                     SVMVGGWGGLNQTQLRKIMAYSSIAHMGWMAAIMMYSPTMMILNLTIYIIMTLTTFML
                     FMHNSTTTTSSLSQTWNKTPLITSFILVLMMSLGGLPPLSGFIPKWMIIQGLTKNEMI
                     MMPTLLAMTALLNLYFYMRLTYTTALTMFPSNN
2 gene участок, с присвоенным ему именем и имеющий интерес в биологии
     gene            4870..5911
                     /gene="ND2"
                     /db_xref="GeneID:6262376"
3 rRNA участок, кодирующий рибосомальную РНК
     rRNA            2053..3624
                     /product="l-rRNA"
                     /note="16S ribosomal RNA"
4 repeat_region участок генома, содержащий повторяющиеся элементы
     repeat_region   1129..1137
                     /note="variable polyC region"
                     /rpt_type=tandem
                     /rpt_unit_seq="c"	
5 tRNA участок генома, кодирующий транспортную РНК
     tRNA            complement(14119..14187)
                     /product="tRNA-Glu"
6 D-loop регион,1)в котором произошло смещение последовательности ДНК митохондрии из-за встроенного в этом месте участка РНК или 2)в котором произошло смещение последовательности одной из цепей ДНК из-за встроенного одноцепочечного участка, для реализации реакции, протекающей под действием фермента RecA protein
     D-loop          15469..16382
7 misc_feature область биологического интереса; какая-то редкая или новая особенность
     misc_feature    join(16404..16964,1..954)
                     /note="control region; CR"

TASK3. Описание состояния дел в одном из массовых геномных проектов

название проекта The Bird 10,000 Genomes (B10K)
цель initiative to generate representative draft genome sequences from all extant bird species within the next five years (2015-2020).
год начала The announcement of the B10K Project was published on 3rd June 2015 in Nature
организация a large international consortium led by researchers from BGI, University of Copenhagen, and Duke University, and including investigators from more than 20 countries and then it has expanded through the addition of three more institutes as part of the leadership board: the Kunming Institute of Zoology and Institute of Zoology of Chinese Academy of Science in Beijing; the Smithsonian Institution in the USA; and the Center of Macroecology, Evolution and Climate in Denmark
страна China,USA,Denmark
сколько геномов секвенировано на 2017 год
B10K is processing 2,500 samples, representing 2,400 species from 1,370 genera, 300 families, and 36 orders.
последняя публикация по проекту (ссылка на PubMed) last publication AND LIST of publications

TASK4. Таблица митохондриальных генов одного из организмов указаного таксона
банк-архив NCBI
запрос (((platyhelminthes[Organism]) AND complete[Title]) AND mitochondrion[Title]) AND genome[All Fields]
число находок в GenBank 375
число находок в Refseq 111
название Aglaiogyrodactylus forficulatus
AC выбранной записи банка NC_030339.1
ссылка на таблицу генов белков, закодированных в митохондриальном геноме

EXCEL

© Цыганов Кирилл, 2017