Выбранный мной организм - Danio rerio (zebrafish). Широко используется в качестве модельного объекта.
Сборок генома указано 2: GRCz10 (GCA_000002035.3) и WGS31 (GCA_000767325.1). Обе получены в проекте PRJNA11776 из образцов SAMN03020626 и SAMEA3146315 соответственно.
Я выбрал сборку GRCz10 - самую полную (высокий Level)
Для этой сборки использовался набор из 7 отдельных образцов с BioSample ID: SAMN03014687-SAMN03014693
Проект по секвенированию генома Danio rerio, PRJNA11776, был начат в 2001 году в Институте Сэнгера (The Wellcome Trust Sanger Institute).
Предыдущий WGS проект - CABZ00000000, представляет сборку генома WGS31, полученную при использовании метода Illumina и прочтения по Сэнгеру.
Он был заменен новым проектом, в котором закрыты многие гэпы и определено положение участков генома нелокализованных ранее.
Сейчас секвенирование производится группой GRC (Genome Reference Consortium).
Таблица 1. Информация о сборке GRCz10
WGS проект для сборки GRCz10 не указан. Поэтому данные о контигах я взял для другой сборки - WGS31.
Ее WGS проект - CABZ01
Ссылка на файл с таблицей контигов.Самый длинный контиг имеет длину 215016 bp (CABZ01060317), самые короткие длиной 501 bp (их три - CABZ01021198, CABZ01083106 и CABZ01088203).
Для данной сборки N50 для контигов - 24,925, L50 для контигов - 16,539 (эта сборка видимо хуже).
Ссылка на последовательность контига CABZ01000035.1.Исследованный мной вид - Syntrichia filaris
По запросу 'Syntrichia filaris[ORGN] gene_in_mitochondrion[PROP] complete genome[TI]' вышел только необходимый митохондриальный геном RefSeq NC_027515.1
Число генов РНК - 27 (3 рРНК, 24 тРНК), число генов белков - 40 (а всего генов 67)
Ссылка на файл с таблицей генов.misc_binding 51078..51102 FT /note='99-79335-60.probe' FT misc_binding 61281..61305 FT /note='99-79336-369.probe' FT misc_binding 80590..80614 FT /note='99-79338-332.probe'
misc_feature complement(join(101615..101707,101711..101797)) /locus_tag="Hqrw_1098" /note="locus_tag: Hqrw_1098; product: conserved hypothetical protein (nonfunctional); gene has an in-frame stop codon and is truncated at the N-terminus" /pseudo
FT modified_base (3)..(3) FT a, c, t, g, unknown or other
polyA_site 5161 /gene="COL15A1"
mobile_element 72..234 /gene="NAA16" /mobile_element_type="SINE:WSINE1"
ncRNA 3475..3524 /ncRNA_class="other" /locus_tag="SM2011_c06000" /product="putative ncRNA" /note="corresponds to SMc06000; based on oriented RNAseq data"
FT protein_bind 191..206 FT protein_bind 193..204 FT protein_bind 193..204 FT protein_bind complement(193..204)
regulatory complement(5755..5785) /regulatory_class="promoter" /note="lac promoter; promoter for the E. coli lac operon"
rep_origin 5681..5713
3'UTR 6273..6431 /gene="3'UTR" /locus_tag="NZ87_gp6"
Последовательность определенно является частью гена, кодирующего гистон 3 (H3)
Таксономия
Eumetazoa [animals] . Bilateria [animals] . . Protostomia [animals] . . . Lophotrochozoa [animals] . . . . Polychaeta [segmented worms] . . . . . Palpata [segmented worms] . . . . . . Canalipalpata [segmented worms] . . . . . . . Brada inhabilis --------------------- 618 2 hits [segmented worms] Brada inhabilis voucher WS1017 histone H3 gene, partial cds . . . . . . . Sclerolinum brattstromi ............. 486 1 hit [tube worms] Sclerolinum brattstromi histone H3 (H3) gene, partial cds . . . . . . Onuphis iridescens -------------------- 529 1 hit [segmented worms] Onuphis iridescens histone H3 gene, partial cds . . . . . . Nereimyra punctata .................... 522 1 hit [segmented worms] Nereimyra punctata isolate A histone H3 (H3) gene, partial . . . . . . Glycera tridactyla .................... 502 1 hit [segmented worms] Glycera tridactyla histone H3 gene, partial cds . . . . . Ophelia limacina ------------------------ 553 3 hits [segmented worms] Ophelia limacina isolate B histone H3 (H3) gene, partial cds . . . . . Chaetozone setosa ....................... 551 3 hits [segmented worms] Chaetozone setosa isolate F histone H3 (H3) gene, partial c . . . . . Amphitrite figulus ...................... 547 2 hits [segmented worms] Amphitrite figulus voucher WS58 histone H3 gene, partial cds . . . . . Ophelina acuminata ...................... 531 4 hits [segmented worms] Ophelina acuminata histone H3 gene, partial cds . . . . . Ophelina sp. pol407 ..................... 524 1 hit [segmented worms] Ophelina sp. pol407 histone H3 gene, partial cds >gi|357433 . . . . . Ophelina sp. pol409 ..................... 524 1 hit [segmented worms] Ophelina sp. pol407 histone H3 gene, partial cds >gi|357433 . . . . . Ophelina sp. pol408 ..................... 524 1 hit [segmented worms] Ophelina sp. pol408 histone H3 gene, partial cds . . . . . Ophelina sp. pol406 ..................... 524 1 hit [segmented worms] Ophelina sp. pol406 histone H3 gene, partial cds . . . . . Ophelina cylindricaudata ................ 517 2 hits [segmented worms] Ophelina cylindricaudata histone H3 gene, partial cds . . . . . Ophelia bicornis ........................ 517 1 hit [segmented worms] Ophelia bicornis histone H3 gene, partial cds . . . . . Ophelina sp. pol413 ..................... 513 1 hit [segmented worms] Ophelina sp. pol413 histone H3 gene, partial cds . . . . . Ophelina sp. pol410 ..................... 511 1 hit [segmented worms] Ophelina sp. pol410 histone H3 gene, partial cdsСсылка на выравнивание
Последовательность - участок гена, кодирующего гистон 3 (H3). Предполагаемый таксон - Canalipalpata - лучшая находка - Brada inhabilis. Ее уровень сходства - 1 замена на 100 п.н.
Для представителя другого таксона - Ophelia (Ophelia limacina) - уровень сходства 8 замен на 100 п.н.
Для представителя таксона более высокого уровня - Nannobrachium hawaiiensis (костная рыба) - уровень сходства 11 замен на 100 п.н.
Eumetazoa .................................. 112 hits 92 orgs [root; cellular organisms; Eukaryota; Opisthokonta; Metazoa] . Bilateria ................................ 111 hits 91 orgs . . Protostomia ............................ 91 hits 78 orgs . . . Lophotrochozoa ....................... 65 hits 52 orgs . . . . Polychaeta ......................... 48 hits 38 orgs [Annelida] . . . . . Palpata .......................... 6 hits 5 orgs . . . . . . Canalipalpata .................. 3 hits 2 orgs . . . . . . . Brada inhabilis .............. 2 hits 1 orgs [Flabelligerida; Flabelligeridae; Brada] . . . . . . . Sclerolinum brattstromi ...... 1 hits 1 orgs [Sabellida; Siboglinidae; Sclerolinum] . . . . . . Aciculata ...................... 3 hits 3 orgs . . . . . . . Onuphis iridescens ........... 1 hits 1 orgs [Eunicida; Onuphidae; Onuphis] . . . . . . . Phyllodocida ................. 2 hits 2 orgs . . . . . . . . Nereimyra punctata ......... 1 hits 1 orgs [Hesionidae; Nereimyra] . . . . . . . . Glycera tridactyla ......... 1 hits 1 orgs [Glyceridae; Glycera] . . . . . Scolecida ........................ 41 hits 32 orgs . . . . . . Opheliidae ..................... 32 hits 26 orgs . . . . . . . Ophelia ...................... 5 hits 3 orgs . . . . . . . . Ophelia limacina ........... 3 hits 1 orgs . . . . . . . . Ophelia bicornis ........... 1 hits 1 orgs . . . . . . . . Ophelia neglecta ........... 1 hits 1 orgs . . . . . . . Ophelina ..................... 23 hits 19 orgs . . . . . . . . Ophelina acuminata ......... 4 hits 1 orgs . . . . . . . . Ophelina sp. pol407 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol409 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol408 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol406 ........ 1 hits 1 orgs . . . . . . . . Ophelina cylindricaudata ... 2 hits 1 orgs . . . . . . . . Ophelina sp. pol413 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol410 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol243 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol244 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol249 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. F14588 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol333 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. B2SC00P1 ...... 1 hits 1 orgs . . . . . . . . Ophelina sp. pol248 ........ 1 hits 1 orgs . . . . . . . . Ophelina sp. pol334 ........ 1 hits 1 orgs ......................................................................................................................... . . Chordata ............................... 20 hits 13 orgs [Deuterostomia] . . . Clupeocephala ........................ 17 hits 12 orgs [Craniata; Vertebrata; Gnathostomata; Teleostomi; Euteleostomi; Actinopterygii; Actinopteri; Neopterygii; Teleostei; Osteoglossocephalai] . . . . Hypostomus ......................... 6 hits 3 orgs [Otomorpha; Ostariophysi; Otophysa; Characiphysae; Siluriformes; Loricaroidei; Loricariidae; Hypostominae] . . . . . Hypostomus ancistroides .......... 1 hits 1 orgs . . . . . Hypostomus nigromaculatus ........ 3 hits 1 orgs . . . . . Hypostomus strigaticeps .......... 2 hits 1 orgs . . . . Ctenosquamata ...................... 11 hits 9 orgs [Euteleosteomorpha; Neoteleostei; Eurypterygia] . . . . . Myctophidae ...................... 10 hits 8 orgs [Myctophata; Myctophiformes] . . . . . . Diaphus ........................ 2 hits 2 orgs . . . . . . . Diaphus anderseni ............ 1 hits 1 orgs . . . . . . . Diaphus parri ................ 1 hits 1 orgs . . . . . . Nannobrachium .................. 5 hits 3 orgs . . . . . . . Nannobrachium hawaiiensis .... 3 hits 1 orgs . . . . . . . Nannobrachium bristori ....... 1 hits 1 orgs . . . . . . . Nannobrachium fernae ......... 1 hits 1 orgs . . . . . . Taaningichthys minimus ......... 1 hits 1 orgs [Taaningichthys] . . . . . . Lampanyctus festivus ........... 1 hits 1 orgs [Lampanyctus] . . . . . . Triphoturus nigrescens ......... 1 hits 1 orgs [Triphoturus] . . . . . Plectorhinchus mediterraneus ..... 1 hits 1 orgs [Acanthomorphata; Euacanthomorphacea; Percomorphaceae; Eupercaria; Eupercaria incertae sedis; Haemulidae; Plectorhinchus] . . . Branchiostoma floridae ............... 3 hits 1 orgs [Cephalochordata; Branchiostomidae; Branchiostoma] . Nematostella vectensis ................... 1 hits 1 orgs [Cnidaria; Anthozoa; Hexacorallia; Actiniaria; Edwardsiidae; Nematostella]