Задание 1: Выбрать качественную сборку генома эукариотического организма
Danio rerio (zebrafish) - это модельный организм (26 хромосом), поэтому я решил выбрать этот вид рыб, так как модельный организм будет иметь более исследованный геном.
Запрос: Danio rerio (zebrafish)
Поиск выдал 17 сборок
У выбранной сборки хромосомный уровень, значит изучена последовательность для одной или нескольких хромосом. Это
может быть полностью секвенированная хромосома без гэпов
или хромосома, содержащая скэффолды или контиги с
гэпами между ними. Также могут быть неразмещенные или
нелокализованные скэффолды.
Выборка является референсной - выборка, отобранная специалистами-людьми как наиболее хорошо описывающая организм.
Задание 2: Некоторые характеристики сборки в виде таблицы
Идентификатор GenBank | Идентификатор RefSeq | Общий размер генома | N50 для контигов | L50 для контигов | N50 для скэффолдов | L50 для скэффолдов |
GCA_000002035.4 | GCF_000002035.6 | 1.4 Gb | 1.4 Mb | 219 | 7.4 Mb | 44 |
N50 обозначает длину контига/скэффолда, для которого 50% всех нуклеотидов сборки содержится в контигах/скэффолдах такой же или большей длины.
L50 обозначет наименьшее число контигов/скэффолдов, в которых содержится 50% всех нуклеотидов сборки.