Для этого практикума была выбрана курица(Gallus gallus). Курица-это самая распространенная в мире птица. Также курицей называют тушку или мясо птички.
Курица диплоидна. Количество хромосом-78
Поисковый запрос-Gallus gallus. Было выдано 43 генома. Два из них имеют аннотацию RefSeq. Выбрал первую сборку. Сборка( GCF_016699485.2) выполнена на уровне chromosome, что означает, что данный геном собран до уровня целых хромосом.
Идентификатор GenBank | Идентификатор RefSeq | Общий размер генома (п.н.(b)) | Число фрагментов генома в сборке | N50(контиги) | L50(контиги) | N50(скэффолды) | L50(скэффолды) | GCF_016699485.1 | GCF_016699485.2 | 1.1 Gb | 41 | 18.8 Mb | 18 | 90.9 Mb | 4 |
---|
N50: длина элемента, для которого половина (50%) всех нуклеотидов сборки содержится в элементах такой и большей длины.
L50: Число элементов(наименьшее), в которых содержится половина (50%) всех нуклеотидов сборки.
В сборке есть все аутосомы и половые хромосомы. Также геном отмечается как референсный. Также показатель N50(контиги) достаточно большой. Судя по этим фактам, качество сборки-хорошее.
Нуклеотидные последовательности генома(FASTA) | Последовательности белков(FASTA) | Последовательности генома с аннотацией(GBFF) | GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.fna.gz | GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_protein.faa.gz | GCF_016699485.2_bGalGal1.mat.broiler.GRCg7b_genomic.gbff.gz |
---|
Первое: нуклеотидные последовательности всех хромосом в fasta. Второе: белковые последовательности всех белков. Третье: файл, в котором сначала идет идентификатор, название организма, краткое описание записи, потом аннотация участков, а далее идет сама последовательность