Банки нуклеотидных последовательностей

Задание 1. Качество сборки эукариотического организма

Выбранный мной организм - Danio rerio (zebrafish). Широко используется в качестве модельного объекта.

Сборок генома указано 2: GRCz10 (GCA_000002035.3) и WGS31 (GCA_000767325.1). Обе получены в проекте PRJNA11776 из образцов SAMN03020626 и SAMEA3146315 соответственно.

Я выбрал сборку GRCz10 - самую полную (высокий Level)

Для этой сборки использовался набор из 7 отдельных образцов с BioSample ID: SAMN03014687-SAMN03014693

Проект по секвенированию генома Danio rerio, PRJNA11776, был начат в 2001 году в Институте Сэнгера (The Wellcome Trust Sanger Institute).

Предыдущий WGS проект - CABZ00000000, представляет сборку генома WGS31, полученную при использовании метода Illumina и прочтения по Сэнгеру.

Он был заменен новым проектом, в котором закрыты многие гэпы и определено положение участков генома нелокализованных ранее.

Сейчас секвенирование производится группой GRC (Genome Reference Consortium).

Таблица 1. Информация о сборке GRCz10

WGS проект для сборки GRCz10 не указан. Поэтому данные о контигах я взял для другой сборки - WGS31.

Ее WGS проект - CABZ01

Ссылка на файл с таблицей контигов.

Самый длинный контиг имеет длину 215016 bp (CABZ01060317), самые короткие длиной 501 bp (их три - CABZ01021198, CABZ01083106 и CABZ01088203).

Для данной сборки N50 для контигов - 24,925, L50 для контигов - 16,539 (эта сборка видимо хуже).

Ссылка на последовательность контига CABZ01000035.1.

Задание 2. Мох

Исследованный мной вид - Syntrichia filaris

По запросу 'Syntrichia filaris[ORGN] gene_in_mitochondrion[PROP] complete genome[TI]' вышел только необходимый митохондриальный геном RefSeq NC_027515.1

Число генов РНК - 27 (3 рРНК, 24 тРНК), число генов белков - 40 (а всего генов 67)

Ссылка на файл с таблицей генов.

Задание 3. Описание ключей в таблицах особенностей

    Ключи
  1. misc_binding - участок нуклеиновой кислоты, который ковалентно или нековалентно связывается с некоторой молекулой, не являющейся белком или праймером. Пример - DL128564.1
    misc_binding    51078..51102
                FT                   /note='99-79335-60.probe'
                FT   misc_binding    61281..61305
                FT                   /note='99-79336-369.probe'
                FT   misc_binding    80590..80614
                FT                   /note='99-79338-332.probe'
  2. misc_feature - участок, представляющий интерес, не описывающийся другими ключами; новое или редкое свойство. Пример - FR746099.1
    misc_feature    complement(join(101615..101707,101711..101797))
                         /locus_tag="Hqrw_1098"
                         /note="locus_tag: Hqrw_1098;
                         product: conserved hypothetical protein (nonfunctional);
                         gene has an in-frame stop codon and is truncated at the
                         N-terminus"
                         /pseudo
  3. modified_base - модифицированный нуклеотид и должен быть замещен указанной молекулой. Пример - DI478390.1
    FT   modified_base   (3)..(3)
                FT   a, c, t, g, unknown or other
  4. polyA_site - сайт РНК-транскрипта, к которому будут присоединены адениновые остатки в процессе пост-транскрипционного полиаденилирования. Пример - L25286.1
    polyA_site      5161
                         /gene="COL15A1"
  5. mobile_element - участок генома, содержащий подвижные элементы. LN774864.1
    mobile_element  72..234
                         /gene="NAA16"
                         /mobile_element_type="SINE:WSINE1"
  6. ncRNA - ген некодирующей РНК. CP004140.1
    ncRNA           3475..3524
                         /ncRNA_class="other"
                         /locus_tag="SM2011_c06000"
                         /product="putative ncRNA"
                         /note="corresponds to SMc06000;
                         based on oriented RNAseq data"
  7. protein_bind - участок нуклеиновой кислоты, с которой нековалентно связывается белок. BD076083.1
    FT   protein_bind    191..206
                FT   protein_bind    193..204
                FT   protein_bind    193..204
                FT   protein_bind    complement(193..204)
  8. regulatory - участок последовательности, регулирующий транскрипцию или трансляцию (промотор, энхансер, терминатор, участок связывания с рибосомами, GC-участок, и т.д.). Пример -
    regulatory      complement(5755..5785)
                         /regulatory_class="promoter"
                         /note="lac promoter; promoter for the E. coli lac operon"
  9. rep_origin - ориджин репликации. NC_005943.1
    rep_origin      5681..5713
  10. 3'UTR - 1) участок на 3' конце зрелого транскрипта (следует за стоп-кодоном), который не транслируется в белок 2) участок на 3' конце РНК вируса (следует за последним стоп-кодоном) который не транслируется в белок
    3'UTR           6273..6431
                         /gene="3'UTR"
                         /locus_tag="NZ87_gp6"

Задание 4. Последовательность из практикума 6

Ссылка на последовательность

Последовательность определенно является частью гена, кодирующего гистон 3 (H3)

Таксономия

Eumetazoa      [animals]
. Bilateria      [animals]
. . Protostomia    [animals]
. . . Lophotrochozoa [animals]
. . . . Polychaeta     [segmented worms]
. . . . . Palpata        [segmented worms]
. . . . . . Canalipalpata  [segmented worms]
. . . . . . . Brada inhabilis ---------------------  618 2 hits [segmented worms]  Brada inhabilis voucher WS1017 histone H3 gene, partial cds
. . . . . . . Sclerolinum brattstromi .............  486 1 hit  [tube worms]       Sclerolinum brattstromi histone H3 (H3) gene, partial cds
. . . . . . Onuphis iridescens --------------------  529 1 hit  [segmented worms]  Onuphis iridescens histone H3 gene, partial cds
. . . . . . Nereimyra punctata ....................  522 1 hit  [segmented worms]  Nereimyra punctata isolate A histone H3 (H3) gene, partial 
. . . . . . Glycera tridactyla ....................  502 1 hit  [segmented worms]  Glycera tridactyla histone H3 gene, partial cds
. . . . . Ophelia limacina ------------------------  553 3 hits [segmented worms]  Ophelia limacina isolate B histone H3 (H3) gene, partial cds
. . . . . Chaetozone setosa .......................  551 3 hits [segmented worms]  Chaetozone setosa isolate F histone H3 (H3) gene, partial c
. . . . . Amphitrite figulus ......................  547 2 hits [segmented worms]  Amphitrite figulus voucher WS58 histone H3 gene, partial cds
. . . . . Ophelina acuminata ......................  531 4 hits [segmented worms]  Ophelina acuminata histone H3 gene, partial cds
. . . . . Ophelina sp. pol407 .....................  524 1 hit  [segmented worms]  Ophelina sp. pol407 histone H3 gene, partial cds >gi|357433
. . . . . Ophelina sp. pol409 .....................  524 1 hit  [segmented worms]  Ophelina sp. pol407 histone H3 gene, partial cds >gi|357433
. . . . . Ophelina sp. pol408 .....................  524 1 hit  [segmented worms]  Ophelina sp. pol408 histone H3 gene, partial cds
. . . . . Ophelina sp. pol406 .....................  524 1 hit  [segmented worms]  Ophelina sp. pol406 histone H3 gene, partial cds
. . . . . Ophelina cylindricaudata ................  517 2 hits [segmented worms]  Ophelina cylindricaudata histone H3 gene, partial cds
. . . . . Ophelia bicornis ........................  517 1 hit  [segmented worms]  Ophelia bicornis histone H3 gene, partial cds
. . . . . Ophelina sp. pol413 .....................  513 1 hit  [segmented worms]  Ophelina sp. pol413 histone H3 gene, partial cds
. . . . . Ophelina sp. pol410 .....................  511 1 hit  [segmented worms]  Ophelina sp. pol410 histone H3 gene, partial cds
Ссылка на выравнивание

Последовательность - участок гена, кодирующего гистон 3 (H3). Предполагаемый таксон - Canalipalpata - лучшая находка - Brada inhabilis. Ее уровень сходства - 1 замена на 100 п.н.

Для представителя другого таксона - Ophelia (Ophelia limacina) - уровень сходства 8 замен на 100 п.н.

Для представителя таксона более высокого уровня - Nannobrachium hawaiiensis (костная рыба) - уровень сходства 11 замен на 100 п.н.

Eumetazoa ..................................   112 hits   92 orgs [root; cellular organisms; Eukaryota; Opisthokonta; Metazoa]
. Bilateria ................................   111 hits   91 orgs 
. . Protostomia ............................    91 hits   78 orgs 
. . . Lophotrochozoa .......................    65 hits   52 orgs 
. . . . Polychaeta .........................    48 hits   38 orgs [Annelida]
. . . . . Palpata ..........................     6 hits    5 orgs 
. . . . . . Canalipalpata ..................     3 hits    2 orgs 
. . . . . . . Brada inhabilis ..............     2 hits    1 orgs [Flabelligerida; Flabelligeridae; Brada]
. . . . . . . Sclerolinum brattstromi ......     1 hits    1 orgs [Sabellida; Siboglinidae; Sclerolinum]
. . . . . . Aciculata ......................     3 hits    3 orgs 
. . . . . . . Onuphis iridescens ...........     1 hits    1 orgs [Eunicida; Onuphidae; Onuphis]
. . . . . . . Phyllodocida .................     2 hits    2 orgs 
. . . . . . . . Nereimyra punctata .........     1 hits    1 orgs [Hesionidae; Nereimyra]
. . . . . . . . Glycera tridactyla .........     1 hits    1 orgs [Glyceridae; Glycera]
. . . . . Scolecida ........................    41 hits   32 orgs 
. . . . . . Opheliidae .....................    32 hits   26 orgs 
. . . . . . . Ophelia ......................     5 hits    3 orgs 
. . . . . . . . Ophelia limacina ...........     3 hits    1 orgs 
. . . . . . . . Ophelia bicornis ...........     1 hits    1 orgs 
. . . . . . . . Ophelia neglecta ...........     1 hits    1 orgs 
. . . . . . . Ophelina .....................    23 hits   19 orgs 
. . . . . . . . Ophelina acuminata .........     4 hits    1 orgs 
. . . . . . . . Ophelina sp. pol407 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol409 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol408 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol406 ........     1 hits    1 orgs 
. . . . . . . . Ophelina cylindricaudata ...     2 hits    1 orgs 
. . . . . . . . Ophelina sp. pol413 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol410 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol243 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol244 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol249 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. F14588 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol333 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. B2SC00P1 ......     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol248 ........     1 hits    1 orgs 
. . . . . . . . Ophelina sp. pol334 ........     1 hits    1 orgs 

.........................................................................................................................

. . Chordata ...............................    20 hits   13 orgs [Deuterostomia]
. . . Clupeocephala ........................    17 hits   12 orgs [Craniata; Vertebrata; Gnathostomata; Teleostomi; Euteleostomi; Actinopterygii; Actinopteri; Neopterygii; Teleostei; Osteoglossocephalai]
. . . . Hypostomus .........................     6 hits    3 orgs [Otomorpha; Ostariophysi; Otophysa; Characiphysae; Siluriformes; Loricaroidei; Loricariidae; Hypostominae]
. . . . . Hypostomus ancistroides ..........     1 hits    1 orgs 
. . . . . Hypostomus nigromaculatus ........     3 hits    1 orgs 
. . . . . Hypostomus strigaticeps ..........     2 hits    1 orgs 
. . . . Ctenosquamata ......................    11 hits    9 orgs [Euteleosteomorpha; Neoteleostei; Eurypterygia]
. . . . . Myctophidae ......................    10 hits    8 orgs [Myctophata; Myctophiformes]
. . . . . . Diaphus ........................     2 hits    2 orgs 
. . . . . . . Diaphus anderseni ............     1 hits    1 orgs 
. . . . . . . Diaphus parri ................     1 hits    1 orgs 
. . . . . . Nannobrachium ..................     5 hits    3 orgs 
. . . . . . . Nannobrachium hawaiiensis ....     3 hits    1 orgs 
. . . . . . . Nannobrachium bristori .......     1 hits    1 orgs 
. . . . . . . Nannobrachium fernae .........     1 hits    1 orgs 
. . . . . . Taaningichthys minimus .........     1 hits    1 orgs [Taaningichthys]
. . . . . . Lampanyctus festivus ...........     1 hits    1 orgs [Lampanyctus]
. . . . . . Triphoturus nigrescens .........     1 hits    1 orgs [Triphoturus]
. . . . . Plectorhinchus mediterraneus .....     1 hits    1 orgs [Acanthomorphata; Euacanthomorphacea; Percomorphaceae; Eupercaria; Eupercaria incertae sedis; Haemulidae; Plectorhinchus]
. . . Branchiostoma floridae ...............     3 hits    1 orgs [Cephalochordata; Branchiostomidae; Branchiostoma]
. Nematostella vectensis ...................     1 hits    1 orgs [Cnidaria; Anthozoa; Hexacorallia; Actiniaria; Edwardsiidae; Nematostella]

Моя главная страница
© Sergey Starikov, 2015