Банки нуклеотидных последовательностей

I

Для описания был выбран геном трихоплакса (Trichoplax adhaerens) — единственного представителя типа Placozoa. Таксономическое положение трихоплакса: Eukaryota; Metazoa; Placozoa; Trichoplax; Trichoplax adhaerens. На данный момент есть всего одна сборка его генома и всего один проект по секвенированию этого животного (образец тоже всего один).

Из BioSample можно узнать идентефикационный номер образца (Accession Number) — SAMN02953699, а также код штамма трихоплакса — Grell-BS-1999. Там же можно увидеть ссылку на проект BioProject (PRJNA12874), опирающийся на данный образец. Образцы были предоставлены 8 июня 2014 года DOE Joint Genome Institute (US).

BioProject содержит краткое описание проекта: его Accession Number (PRJNA12874), тип (секвенирование и сборка генома), размах (тут имеют в виду, что исследуется геном одного организма и проект не является метагеномным или т.п.), публикации с проектом (в случае с трихоплаксом это статья в Nature).

Сборка трихоплакса полностью репрезентативна (проект полногеномного секвенирования). Размер генома — 105 631 681 пар оснований, однако в нём присутствует большое количество пропусков («гэпов») — около 10 882 265. Общее число скэффолдов в сборке — 1 414 (таблица контигов, из которых построены скэффолды). Длина самого длинного контига — 830831 нуклеотид, самого короткого — 65, N50 — 204 191, L50 — 132. Ссылка на последовательность контига TRIADscaffold_1_Cont1.

II

 CDS 
Участок ДНК, несущий информацию об аминокислотной последовательности синтезируемого белка
FEATURES             Location/Qualifiers
     CDS             362..1594
                     /gene="DTEF-1B"
                     /codon_start=1
                     /product="cardiac-enriched TEA domain transcription
                     factor"
                     /protein_id="AAC59787.2"
                     /translation="MDKSLDNDAEGVWSPDIEQSFQEALAIYPPCGRRKIILSDEGKM
                     YGRNELIARYIKLRTGKTRTRKQVSSHIQVLARKKVRSTGWHQAMNLDQVSKDKAFQS
                     MASMSSAQIVSASVLQNKLSPPPPLPQAVFSAAPRFWSGPIPGQPGPSQDIKPFAQPA
                     YPIQPPMPPSLASYEPLAPLPPAASAVPVWQDRTIASAKLRLLEYSAFMEVPRDAETY
                     SKHLFVHIGQTNPSYSDPLLEAMDIRQIYDKFPEKKGGLKELYERGPQNSFFLLKFWA
                     DLNSTIQDGPGTFYGVSSQYSSAENMTITVSTKVCSFGKQVVEKVETEYARLENSRFV
                     YRIHRSPMCEYMINFIHKLKHLPEKYMMNSVLENFTILQVVTNRDTQETLLCIAFVFE
                     VSTSEHGAQHHVYKLVKD"
 mobile_element 
Регион генома, содержащий мобильный элемент (последовательность ДНК, которая может перемещаться внутри генома)
FEATURES             Location/Qualifiers
     mobile_element  complement(7253..9908)
                     /mobile_element_type="insertion sequence:ISEcp1"
 rep_origin 
Регион, содержащий точку начала репликации (Origin)
FEATURES             Location/Qualifiers
     rep_origin      complement(5318..5363)
                     /note="OL"
 ncRNA 
Участок, кодирующий функциональные нетранслирующиеся РНК (за исключением тРНК и рРНК)
FEATURES             Location/Qualifiers
     ncRNA           1..1361
                     /ncRNA_class="lncRNA"
                     /gene="LOC101255182"
                     /product="uncharacterized LOC101255182"
                     /db_xref="GeneID:101255182"
 tmRNA 
Участок, кодирующий транспортно-матричную РНК (одна часть такой РНК выполняет функции тРНК, а другая — мРНК
FEATURES             Location/Qualifiers
     tmRNA           96620..97054
                     /locus_tag="SEA_GABRIEL_186"
 iDNA 
Участок с «промежуточной» ДНК, которая удаляется при рекомбинации
FEATURES             Location/Qualifiers
     iDNA            316..391
                     /note="IES"
 modified_base 
Номер постсинтетически модифицированного нуклеотида
FEATURES             Location/Qualifiers
     modified_base   1
                     /gene="RNU2-1"
                     /gene_synonym="RNU2; U2"
                     /note="1-methyladenosine"
                     /mod_base=m1a
 operon 
Регион, содержащий оперон — группу генов с сопряжённой экспрессией
FEATURES             Location/Qualifiers
     operon          <1..>1546
                     /operon="rrnA"
 oriT 
Точка начала трансфера (с неё начинаются процессы передачи плазмид и проч.)
FEATURES             Location/Qualifiers
     oriT            15948..16349
                     /standard_name="oriT"
 sig_peptide 
Последовательность, которая кодирует сигнальный пепттид
FEATURES             Location/Qualifiers
     sig_peptide     1..54

III

Для того чтобы исследовать генетические механизмы, влияющие на развитие эпилепсии у большинства людей, в 2010 году при финансировании от NINHS (National Institute of Neurological Disorders and Stroke) был создан так называемый «Center without Walls» и запланировано исследование Epi4K, имевшее своей целью отсеквенировать и проанализировать геномы и фенотипы 4000 больных людей. В команде проекта участвовало более 60 учёных с трёх континентов (Северная Америка, Евразия, Австралия). К маю 2013 года в исследованиях приняли участие 4199 людей. Цель достигнута. Но исследования в указанной области всё ещё продолжаются.

IV

Запрос для по поискам митохондриальных геномов таксона Malawimonadidae в GenBank и RefSeq соответственно:

  1. (malawimonadidae[ORGN] AND mitochondrion[TITLE] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE])) AND srcdb_genbank[PROP] — 1 результат
  2. (malawimonadidae[ORGN] AND mitochondrion[TITLE] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE])) AND srcdb_refseq[PROP] — 2 результата

Malawimonadidae — это одно из семейств супергруппы Excavata (для них характерны жгутики, находящиеся в особом желобке, часто формирующем так называемый жгутиковый резервуар). В качестве представителя был выбран протист Malawimonas californiana, для которого имеется полный митохондриальный геном. Таблица с митохондриальными генами доступна по ccылке.