Практикум 7. Банки нуклеотидных последовательностей
Task 1
Hofstenia miamia - это интересный вид, раннее идентифицировавшийся как вид турбеллярий. Современная наука, тем не менее, показала что крупная группа настоящих животных должна определяться как таксон Xenaoelomorpha. Acoela -это древняя группа Билатерий, у которой нет сформированного кишечника. Бескишечные турбеллярии известны за значительные способности к регеерации. В недавнем исследовании группа ученых впервые секвенировала геном Hofstenia miamia (то есть известна одна сборка генома) и обнаружила множество повторяющихся участков, большинство из которых могут быть классифицированы как ретротранспозоны.
Latin name | Hofstenia miamia |
---|---|
Taxonomy | Eukariota; Metazoa; Xenacoelomorpha; Acoela; Hofsteniidae; Hofstenia; Hofstenia miamia |
English name | Three-banded panther worm |
Russian name | Трехполосый червь-пантера |
Genbank accession | GCA_004352715.1 (last) |
RefSeq accession | - |
Assembly level | Scaffold |
Scaffolds | 18347 |
Contigs | 131392 |
Scaffold N50 | 1044515 |
Scaffold L50 | 275 |
Contig N50 | 14255 |
Contig L50 | 16846 |
Total length | 950 Mb |
Информация о геноме найдена на сайте NCBI. После общей характеристики генома нужно было охарактеризовать один из котигов. Мы перешли поссылке в таблице "Genome assembly annotation". На странице проекта секвенирования мы нашли ссылку на WGS. Страница представляет собой список скаффолдов. Мы выбрали один из них и скопировали последовательность (контигов не было, только скаффолды во вкладке "Contigs").
Task 2
В рамках задания нужно было отыскать с помощью Advanced search. Необходимо было найти вирусов семейства Inoviridae с длиной генома 8-9 килобаз. Поиск производился на сайте NCBI в базах Nucleotide (Genbank) и RefSeq. Текст поиска:
(Inoviridae[Organism] AND 8000:9000[Sequence Length]) AND "Complete Genome"
В Genbank нашлось 17 записей, удовлетворяющих условиям, а в RefSeq - 7. Далее нами был выбран геном Xanthomonas phage Xf409. Список CDS получен со страницы генома вируса в fasta-формате.
Latin name | Xanthomonas phage Xf409 |
---|---|
Genbank accession | KY853667.1 |
RefSeq accession | - |
TaxID | 1979540 |
Host | Gamma Proteobacterium Xanthomonas oryzae pv. oryzicola |
Genome type | ss-circDNA |
CDS | 14 |
Total length | 8280 bp |
Task 3
Нужно было найти описание ключей, используемых в таблицах особенностей. Информация найдена на сайте INSDC. некоторые ключи можно разобрать напримерах из описания генома Hofstenia miamia.
/isolate="MS-H3"
/organism="Hofstenia miamia"
/mol_type="genomic DNA"
/db_xref="taxon:442651"
/tissue_type="whole worm"
/country="Bermuda"
/collection_date="01-Jul-2009"
/organism: это организм, который был донором описываемой молекулы. В данном случае очевидно, что когда секвенируют геном червяка, то червяк - это донор ДНК.
/mol_type: очевидно, что когда мы секвенируем геном клеточного организма, то мы исследуем ДНК. У ретровирусов в этой графе может стоять "genomic RNA", если мы ее описываем.
/db_xref: здесь идет ссылка на страницу со ссылками на ДНК-последовательность во внешних базах данных (какой-то определенной направленности, например, таксономической).
/tissue_type: этот ключ важен, когда мы выделяем молекулу из определенный ткани. Это важно, когда мы, например, делаем транскриптомный анализ, где любая мелочь влияет на результат. В данном случае делается секвенирование ДНК всего организма, что здесь и отмечено.
/country, /collection_date: здесь может идти подробная история секвенированного организма: откуда родом его предки, когда их забрали из родных мест ради науки.
/isolate: идентификатор конкретного организма, из которого изолирована ДНК, например, конкретный пациент Иванов Василий Петрович из Вологды.