I
Для описания был выбран геном трихоплакса (Trichoplax adhaerens) — единственного представителя типа Placozoa. Таксономическое положение трихоплакса: Eukaryota; Metazoa; Placozoa; Trichoplax; Trichoplax adhaerens. На данный момент есть всего одна сборка его генома и всего один проект по секвенированию этого животного (образец тоже всего один).
Из BioSample можно узнать идентефикационный номер образца (Accession Number) — SAMN02953699, а также код штамма трихоплакса — Grell-BS-1999. Там же можно увидеть ссылку на проект BioProject (PRJNA12874), опирающийся на данный образец. Образцы были предоставлены 8 июня 2014 года DOE Joint Genome Institute (US).
BioProject содержит краткое описание проекта: его Accession Number (PRJNA12874), тип (секвенирование и сборка генома), размах (тут имеют в виду, что исследуется геном одного организма и проект не является метагеномным или т.п.), публикации с проектом (в случае с трихоплаксом это статья в Nature).
Сборка трихоплакса полностью репрезентативна (проект полногеномного секвенирования). Размер генома — 105 631 681 пар оснований, однако в нём присутствует большое количество пропусков («гэпов») — около 10 882 265. Общее число скэффолдов в сборке — 1 414 (таблица контигов, из которых построены скэффолды). Длина самого длинного контига — 830831 нуклеотид, самого короткого — 65, N50 — 204 191, L50 — 132. Ссылка на последовательность контига TRIADscaffold_1_Cont1.
II
CDS | Участок ДНК, несущий информацию об аминокислотной последовательности синтезируемого белка |
FEATURES Location/Qualifiers CDS 362..1594 /gene="DTEF-1B" /codon_start=1 /product="cardiac-enriched TEA domain transcription factor" /protein_id="AAC59787.2" /translation="MDKSLDNDAEGVWSPDIEQSFQEALAIYPPCGRRKIILSDEGKM YGRNELIARYIKLRTGKTRTRKQVSSHIQVLARKKVRSTGWHQAMNLDQVSKDKAFQS MASMSSAQIVSASVLQNKLSPPPPLPQAVFSAAPRFWSGPIPGQPGPSQDIKPFAQPA YPIQPPMPPSLASYEPLAPLPPAASAVPVWQDRTIASAKLRLLEYSAFMEVPRDAETY SKHLFVHIGQTNPSYSDPLLEAMDIRQIYDKFPEKKGGLKELYERGPQNSFFLLKFWA DLNSTIQDGPGTFYGVSSQYSSAENMTITVSTKVCSFGKQVVEKVETEYARLENSRFV YRIHRSPMCEYMINFIHKLKHLPEKYMMNSVLENFTILQVVTNRDTQETLLCIAFVFE VSTSEHGAQHHVYKLVKD" | |
mobile_element | Регион генома, содержащий мобильный элемент (последовательность ДНК, которая может перемещаться внутри генома) |
FEATURES Location/Qualifiers mobile_element complement(7253..9908) /mobile_element_type="insertion sequence:ISEcp1" | |
rep_origin | Регион, содержащий точку начала репликации (Origin) |
FEATURES Location/Qualifiers rep_origin complement(5318..5363) /note="OL" | |
ncRNA | Участок, кодирующий функциональные нетранслирующиеся РНК (за исключением тРНК и рРНК) |
FEATURES Location/Qualifiers ncRNA 1..1361 /ncRNA_class="lncRNA" /gene="LOC101255182" /product="uncharacterized LOC101255182" /db_xref="GeneID:101255182" | |
tmRNA | Участок, кодирующий транспортно-матричную РНК (одна часть такой РНК выполняет функции тРНК, а другая — мРНК |
FEATURES Location/Qualifiers tmRNA 96620..97054 /locus_tag="SEA_GABRIEL_186" | |
iDNA | Участок с «промежуточной» ДНК, которая удаляется при рекомбинации |
FEATURES Location/Qualifiers iDNA 316..391 /note="IES" | |
modified_base | Номер постсинтетически модифицированного нуклеотида |
FEATURES Location/Qualifiers modified_base 1 /gene="RNU2-1" /gene_synonym="RNU2; U2" /note="1-methyladenosine" /mod_base=m1a | |
operon | Регион, содержащий оперон — группу генов с сопряжённой экспрессией |
FEATURES Location/Qualifiers operon <1..>1546 /operon="rrnA" | |
oriT | Точка начала трансфера (с неё начинаются процессы передачи плазмид и проч.) |
FEATURES Location/Qualifiers oriT 15948..16349 /standard_name="oriT" | |
sig_peptide | Последовательность, которая кодирует сигнальный пепттид |
FEATURES Location/Qualifiers sig_peptide 1..54 |
III
Для того чтобы исследовать генетические механизмы, влияющие на развитие эпилепсии у большинства людей, в 2010 году при финансировании от NINHS (National Institute of Neurological Disorders and Stroke) был создан так называемый «Center without Walls» и запланировано исследование Epi4K, имевшее своей целью отсеквенировать и проанализировать геномы и фенотипы 4000 больных людей. В команде проекта участвовало более 60 учёных с трёх континентов (Северная Америка, Евразия, Австралия). К маю 2013 года в исследованиях приняли участие 4199 людей. Цель достигнута. Но исследования в указанной области всё ещё продолжаются.
IV
Запрос для по поискам митохондриальных геномов таксона Malawimonadidae в GenBank и RefSeq соответственно:
- (malawimonadidae[ORGN] AND mitochondrion[TITLE] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE])) AND srcdb_genbank[PROP] — 1 результат
- (malawimonadidae[ORGN] AND mitochondrion[TITLE] AND ("complete genome"[TITLE] OR "complete sequence"[TITLE])) AND srcdb_refseq[PROP] — 2 результата
Malawimonadidae — это одно из семейств супергруппы Excavata (для них характерны жгутики, находящиеся в особом желобке, часто формирующем так называемый жгутиковый резервуар). В качестве представителя был выбран протист Malawimonas californiana, для которого имеется полный митохондриальный геном. Таблица с митохондриальными генами доступна по ccылке.