Практикум 7. Банки нуклеотидных последовательностей

Task 1

Hofstenia miamia - это интересный вид, раннее идентифицировавшийся как вид турбеллярий. Современная наука, тем не менее, показала что крупная группа настоящих животных должна определяться как таксон Xenaoelomorpha. Acoela -это древняя группа Билатерий, у которой нет сформированного кишечника. Бескишечные турбеллярии известны за значительные способности к регеерации. В недавнем исследовании группа ученых впервые секвенировала геном Hofstenia miamia (то есть известна одна сборка генома) и обнаружила множество повторяющихся участков, большинство из которых могут быть классифицированы как ретротранспозоны.

Публикация

Latin nameHofstenia miamia
TaxonomyEukariota; Metazoa; Xenacoelomorpha; Acoela; Hofsteniidae; Hofstenia; Hofstenia miamia
English nameThree-banded panther worm
Russian nameТрехполосый червь-пантера
Genbank accessionGCA_004352715.1 (last)
RefSeq accession -
Assembly levelScaffold
Scaffolds18347
Contigs131392
Scaffold N501044515
Scaffold L50275
Contig N5014255
Contig L5016846
Total length950 Mb

Информация о геноме найдена на сайте NCBI. После общей характеристики генома нужно было охарактеризовать один из котигов. Мы перешли поссылке в таблице "Genome assembly annotation". На странице проекта секвенирования мы нашли ссылку на WGS. Страница представляет собой список скаффолдов. Мы выбрали один из них и скопировали последовательность (контигов не было, только скаффолды во вкладке "Contigs").

Contig

Task 2

В рамках задания нужно было отыскать с помощью Advanced search. Необходимо было найти вирусов семейства Inoviridae с длиной генома 8-9 килобаз. Поиск производился на сайте NCBI в базах Nucleotide (Genbank) и RefSeq. Текст поиска:

(Inoviridae[Organism] AND 8000:9000[Sequence Length]) AND "Complete Genome"

В Genbank нашлось 17 записей, удовлетворяющих условиям, а в RefSeq - 7. Далее нами был выбран геном Xanthomonas phage Xf409. Список CDS получен со страницы генома вируса в fasta-формате.

Latin nameXanthomonas phage Xf409
Genbank accessionKY853667.1
RefSeq accession -
TaxID1979540
HostGamma Proteobacterium Xanthomonas oryzae pv. oryzicola
Genome typess-circDNA
CDS14
Total length8280 bp

CDS

Task 3

Нужно было найти описание ключей, используемых в таблицах особенностей. Информация найдена на сайте INSDC. некоторые ключи можно разобрать напримерах из описания генома Hofstenia miamia.

/isolate="MS-H3"
/organism="Hofstenia miamia"
/mol_type="genomic DNA"
/db_xref="taxon:442651"
/tissue_type="whole worm"
/country="Bermuda"
/collection_date="01-Jul-2009"

/organism: это организм, который был донором описываемой молекулы. В данном случае очевидно, что когда секвенируют геном червяка, то червяк - это донор ДНК.

/mol_type: очевидно, что когда мы секвенируем геном клеточного организма, то мы исследуем ДНК. У ретровирусов в этой графе может стоять "genomic RNA", если мы ее описываем.

/db_xref: здесь идет ссылка на страницу со ссылками на ДНК-последовательность во внешних базах данных (какой-то определенной направленности, например, таксономической).

/tissue_type: этот ключ важен, когда мы выделяем молекулу из определенный ткани. Это важно, когда мы, например, делаем транскриптомный анализ, где любая мелочь влияет на результат. В данном случае делается секвенирование ДНК всего организма, что здесь и отмечено.

/country, /collection_date: здесь может идти подробная история секвенированного организма: откуда родом его предки, когда их забрали из родных мест ради науки.

/isolate: идентификатор конкретного организма, из которого изолирована ДНК, например, конкретный пациент Иванов Василий Петрович из Вологды.

НАЗАД