Практикум 7

В данном практикуме я выберу сборку генома эукариотического организма, подходящую по некоторым параметрам качества, охарактеризую ее по предложенному плану и скачаю файлы, которые потребуются для работы на следующем занятии.


1 Выбор качественной сборки генома эукариотического организма

Я выбрал организм Neurospora crassa, или нейроспора густая. Тривиального названия на английском не имеет. Это гриб, относящийся к отделу Ascomycota, известный модельный организм для генетики. За работу, выполненную на нейроспоре, Эдвард Татум и Джордж Уэллс Бидл получили Нобелевскую премию по физиологии и медицине в 1958 году. Они предложили гипотезу один ген — один фермент. Также нейроспора используется для изучения мейоза. В вегетативном состоянии нейроспора гаплоидна и имеет 7 хромосом (n-набор).

Рис. 1. Neurospora crassa
Автор изображения: Namboori B. Raju


Поисковой запрос: "Neurospora crassa"
Найдено 9 сборок
Я выбрал сборку NC12, она референсная.
Уровень выбранной сборки: Chromosome
Это означает, что в сборке представлена последовательность одной или нескольких хромосом, причем не обязательно без пробелов.


2 Некоторые характеристики выбранной сборки

Таб. 1. Характеристика сборки генома Neurospora crassa

Assembly GenBank id RefSeq id Genome size Number of scaffolds Number of contigs Scaffold N50 Scaffold L50 Contig N50 Contig L50
NC12

GCA_000182925.2

GCF_000182925.2 41 Mb 20 411 6 Mb 3 656 kb 21

Пояснение:
Contig N50 - максимальная длина контига, такая, что суммарная длина всех контигов не короче данного составляет не менее 50% общей длины всех контигов сборки (для скаффолдов аналогично).
Contig L50 - число контигов, суммарная длина которых не менее 50% от сборки (для скаффолдов аналогично).

Я считаю, что данная сборка отражает биологическую информацию о геноме нейроспоры на вполне должном уровне, так как:

  1. Хромосом столько же, сколько обычно у нейроспоры, и геном нормального размера [1]
  2. Это референсный геном
  3. Значения N50 достаточно большие в сравнении с размером генома, это хорошо
  4. Значения L50 достаточно маленькие, это тоже хорошо

3 Скачивание файлов сборки генома, аннотации и предсказанных белковых последовательностей нейроспоры

  1. GCF_000182925.2_NC12_genomic.fna — последовательность нуклеотидов в геномной ДНК нейроспоры.
  2. GCF_000182925.2_NC12_protein.faa — последовательность белков нейроспоры.
  3. GCF_000182925.2_NC12_genomic.gbff — аннотированная последовательность генома нейроспоры.

ЛИТЕРАТУРА

  1. Galagan, James E et al. «The genome sequence of the filamentous fungus Neurospora crassa.» Nature vol. 422,6934 (2003): 859-68. doi:10.1038/nature01554