Практикум 7

Выбор эукариотического организма.

Для практикума была выбрана морская звезда - Красный астериас (Asterias rubens).

Морские звезды - это удивительные существа, принадлежащие к типу Иглокожие (лат. Eсhinodermata). Геном (состоит из 22 хромосом, гаплоидный). Первые морские звёзды на Земле появились 200-250 миллионов лет назад. В Дании действует единственная в мире фабрика по переработке морских звёзд в белковую кормовую муку для птиц и скота. Морские звёзды обладают сильной способностью к регенерации. Они могут не только отращивать утраченные лучи, но и восстанавливать целое тело из одного фрагмента, если он включает часть центрального диска. Морская звезда (Asterias rubens) – один из самых распространенных видов, обитающий в северной Атлантике.

Рис. 1. Красный астериас (изображение взято с сайта)

По поисковому запросу "Asterias rubens" было найдено 2 сбороки, была выбрана референсная (eAstRub1.3) c аннотацией в RefSeq. Уровень сборки chromosome, что означает, что последовательность ДНК организма была собрана и упорядочена таким образом, что её можно представить на уровне отдельных хромосом (одной или нескольких).

Некоторые характеристики выбранной сборки.

Таблица 1. Характеристики выбранной сборки.
Assembly GenBank RefSeq Genome size Number of scaffolds Number of contigs Scaffold N50 Scaffold L50 Contig N50 Contig L50
eAstRub1.3 GCA_902459465.3

GCF_902459465.1
417.6 Mb

150

621

20.6 Mb

9

1.4 Mb

94

Число хромосом в сборке (22 штук, гаплоидный набор) соответствует литературным данным о Asterias rubens. Однако, есть сомнения, что данная сборка точно отражает биологическую информацию о геноме. Разнятся данные Scaffold N50, Scaffold L50. По новым данным из статьи они составляют 10.85 Mb и 87 соответственно. Так же, в статье предсказано больше генов, кодирующих белки (16 673 гена), чем в сборке (16,079).

Все же, по анализу BUSCO (рис. 2) видно, что качество сборки высокое.

Рис. 2. BUSCO анализ качества геномной сборки.

Скачивание файлов.

  • GCF_902459465.1_eAstRub1.3_genomic.fna - Последовательности генома (в формате FASTA) - файл содержит нуклеотидные последовательности всех хромосом в формате FASTA.
  • GCF_902459465.1_eAstRub1.3_protein.faa - Последовательности белков (в формате FASTA)- файл содержит последовательности всех белков в формате FASTA.
  • GCF_902459465.1_eAstRub1.3_genomic.gbff - Последовательности генома с аннотацией (GBFF) - Файл содержит общую информацию о сборке генома, последовательности и аннотации к ним.