Практикум 7.

Задание 1.

Для данного задания в качестве эукариотического организма я выбрал Ирбиса (Panthera uncia). Снежный барс обитает в горах Центральной Азии и обладает очень красивым буровато-серым окрасом с темными кольцевидными пятнами, а также длинным хвостом и немного короткими лапами, что добавляет некоторую комичность его внешнему виду. Период его активности приходится на сумеречное время; днем же ирбис прячется в пещерах или расселинах скал. Данный вид находится под угрозой исчезновения и занесен не только в Красную книгу России, но и в CITES (конвенцию о международной торговле исчезающими видами).

Рис. 1. Снежный барс (источник изображения).

В базе данных NCBI по запросу Panthera uncia (snow leopard) есть две сборки. У обоих уровень сборки Chromosome (присутсвует последовательность одной или более хромосом. Она может соответствовать полной последовательности хромосомы или содержать скаффолды и континги с гэпами между ними), однако только одна из них была референсой (вручную отобранный геном, который был выбран NCBI как эталон при сравнении с другими данными). Её я и выбрал для выполнения практикума.

Задание 2.

В таблице 1 представлены характеристики выбранной сборки:

Таблица 1.
Идентификатор GenBank Идентификатор RefSeq Общий размер генома (Mb) Scaffold N50 Scaffold L50 Contig N50 Contig L50
GCA_023721935.1 GCF_023721935.1 2,434 112.1 Mb 9 179.5 kb 3,996

Contig N50 - длина контига такая, что сумма длины контигов, длины которых не меньше длины данного контига, содержит хотя бы половину всех нуклеотидов в сборке (аналогично определяется Scaffold N50).

Conting L50 - минимальное количество контигов, сумма длин которых содержит хотя бы половину всех нуклеотидов сборки (аналогично для скэффолдов).

Задание 3.

Список скаченных файлов:

  1. GCF_023721935.1_Puncia_PCG_1.0_genomic.fna.gz (нуклеотидные последовательности генома в формате FASTA)
  2. GCF_023721935.1_Puncia_PCG_1.0_protein.faa.gz (последовательности белков в формате FASTA)
  3. GCF_023721935.1_Puncia_PCG_1.0_genomic.gbff.gz (последовательности генома с аннотацией в формате GBFF)