В качесвте эукариотического организма я выбрал рыбку Данио-рерио (Лат. Danio rerio), это модельный организм, аквариумная рыбка семейства лучеперых, размерами от 2,5 до 4-х см. Данный организм использовался в изучении мбрионального развития и функций генов позвоночных. Длина генома – 1,4 млрд. п.о., число генов – 26 тысяч, 25 хромосом.
Мой поисковый запрос был следующим: Danio rerio. По данному запросу было найдено 19 сборок, одна из них была референсной и аннотированной, ее я и выбрал.
Уровень сборки - Chromosome, это означает, что в сборке есть как минимум одна хромосома, но неизвестно, есть ли контиги или гэпы.
N50 - длина контига, для которого 50% всех нуклеотидов сборки содержится в контигах такой и большей длины (максимальная длина контига находится в столбике "L50").
L50 - наименьшее число контигов, в которых содержится 50% всех нуклеотидов сборки - их суммарная длина достигает хотя бы 50%
В 44 скэффолдах содержится 50% нуклеотидов сборки, длина наименьшего скэффолда из них - 7.4 Mb. В 219 контигах одержится 50% нуклеотидов сборки, длина наименьшего контига из них - 1.4 Mb.
Были скачаны следующие файлы:
GCF_000002035.6_GRCz11_genomic.fna - cодержит информацию о нуклеотидной последовательности генома в FASTA формате.
GCF_000002035.6_GRCz11_genomic.gbff - содержит информацию о последовательности генома с аннотацией в GBFF формате.
GCF_000002035.6_GRCz11_protein.faa - содержит информацию о последовательности белков в FASTA формате.