Я искал геном тигра (лат. Panthera tigris). Тигры являются крупнейшими представителями семейства кошачьих, и из всех наземных хищников по массе, которая может достигать 300-350кг, уступают лишь бурым и белым медведям. На данный момент они относятся к исчезающим видам и суммарное количество особей составляет 4000-6000. Тигры имеют 19 хромосом(в диплоидном наборе 38). По запросу "Panthera tigris" было найдено 6 сборок генома, одна их которых "P.tigris_Pti1_mat1.1" являлась референсной.
Данная сборка подходит для рассмотрения так как она:
1)Имеет качество сборки на уровне хромосом
2)Имеет аннотированные гены в RefSeq.
3)Является референсной.

Таблица 1. Характеристики гаплоидной геномной сборки
| ID GenBank | GCA_018350195.2 | ||||||||
|---|---|---|---|---|---|---|---|---|---|
| ID RefSeq | GCF_018350195.1 | ||||||||
| Общий размер генома (п.н.) | 2.4 Gb | ||||||||
| Число хромосом | 19 | ||||||||
| Число скэффолдов | 74 | ||||||||
| Число контигов | 139 | ||||||||
| Scaffold N50 | 146.9 Mb | ||||||||
| Scaffold L50 | 7 | ||||||||
| Contig N50 | 74.4 Mb | ||||||||
| Contig L50 | 12 |
С помощью FTP с NCBI были скачаны следущие необходимые файлы:
1)"./GCF_018350195.1/genomic.fna" - последовательности ДНК генома
2)"./GCF_018350195.1/genomic.gff" - аннотированный геном
3)"./GCF_018350195.1/protein.faa" - последовательность белков генома