Для данного задания в качестве эукариотического организма я выбрал Ирбиса (Panthera uncia). Снежный барс обитает в горах Центральной Азии и обладает очень красивым буровато-серым окрасом с темными кольцевидными пятнами, а также длинным хвостом и немного короткими лапами, что добавляет некоторую комичность его внешнему виду. Период его активности приходится на сумеречное время; днем же ирбис прячется в пещерах или расселинах скал. Данный вид находится под угрозой исчезновения и занесен не только в Красную книгу России, но и в CITES (конвенцию о международной торговле исчезающими видами).
В базе данных NCBI по запросу Panthera uncia (snow leopard) есть две сборки. У обоих уровень сборки Chromosome (присутсвует последовательность одной или более хромосом. Она может соответствовать полной последовательности хромосомы или содержать скаффолды и континги с гэпами между ними), однако только одна из них была референсой (вручную отобранный геном, который был выбран NCBI как эталон при сравнении с другими данными). Её я и выбрал для выполнения практикума.
В таблице 1 представлены характеристики выбранной сборки:
Идентификатор GenBank | Идентификатор RefSeq | Общий размер генома (Mb) | Scaffold N50 | Scaffold L50 | Contig N50 | Contig L50 |
---|---|---|---|---|---|---|
GCA_023721935.1 | GCF_023721935.1 | 2,434 | 112.1 Mb | 9 | 179.5 kb | 3,996 |
Contig N50 - длина контига такая, что сумма длины контигов, длины которых не меньше длины данного контига, содержит хотя бы половину всех нуклеотидов в сборке (аналогично определяется Scaffold N50).
Conting L50 - минимальное количество контигов, сумма длин которых содержит хотя бы половину всех нуклеотидов сборки (аналогично для скэффолдов).
Список скаченных файлов: