В данном практикуме я выберу сборку генома эукариотического организма, подходящую по некоторым параметрам качества, охарактеризую ее по предложенному плану и скачаю файлы, которые потребуются для работы на следующем занятии.
Я выбрал организм Neurospora crassa, или нейроспора густая. Тривиального названия на английском не имеет. Это гриб, относящийся к отделу Ascomycota, известный модельный организм для генетики. За работу, выполненную на нейроспоре, Эдвард Татум и Джордж Уэллс Бидл получили Нобелевскую премию по физиологии и медицине в 1958 году. Они предложили гипотезу один ген — один фермент. Также нейроспора используется для изучения мейоза. В вегетативном состоянии нейроспора гаплоидна и имеет 7 хромосом (n-набор).
Рис. 1. Neurospora crassa
Автор изображения: Namboori B. Raju
Поисковой запрос: "Neurospora crassa"
Найдено 9 сборок
Я выбрал сборку NC12, она референсная.
Уровень выбранной сборки: Chromosome
Это означает, что в сборке представлена последовательность одной или нескольких хромосом, причем не обязательно без пробелов.
Таб. 1. Характеристика сборки генома Neurospora crassa
Assembly | GenBank id | RefSeq id | Genome size | Number of scaffolds | Number of contigs | Scaffold N50 | Scaffold L50 | Contig N50 | Contig L50 |
---|---|---|---|---|---|---|---|---|---|
NC12 | GCA_000182925.2 |
GCF_000182925.2 | 41 Mb | 20 | 411 | 6 Mb | 3 | 656 kb | 21 |
Пояснение:
Contig N50 - максимальная длина контига, такая, что суммарная длина всех контигов не короче данного составляет не менее 50% общей длины всех контигов сборки (для скаффолдов аналогично).
Contig L50 - число контигов, суммарная длина которых не менее 50% от сборки (для скаффолдов аналогично).
Я считаю, что данная сборка отражает биологическую информацию о геноме нейроспоры на вполне должном уровне, так как:
Galagan, James E et al. «The genome sequence of the filamentous fungus Neurospora crassa.» Nature vol. 422,6934 (2003): 859-68. doi:10.1038/nature01554