Практикум 7  
 

Практикум 7

Для задания был выбран организм: домашняя лошадь

Латинское название: Equus caballus

Английское название: Domestic horse

Параметр Значение Описание
Идентификатор GenBank GCA_041296265.1 -
Идентификатор RefSeq GCF_041296265.1 -
Уровень сборки генома Chromosome -
Общий размер генома (п.н.) 2.8 Gb -
Число фрагментов генома в сборке контигов - 629, скэффолдов - 624 -
Параметр Scaffold N50 99.2 Mb Длина скэффолда, для которого всё скэффолды длиннее, включая этот, покрывают больше 50% генома
Параметр Scaffold L50 12 Наименьшее число скэффолдов, в которых собержится более 50% всех нуклеотидов сборки
Параметр Contig N50 99.2 Mb Длина контига, для которого всё контиги длиннее, включая этот, покрывают больше 50% генома
Параметр Contig L50 12 Наименьшее число контигов, в которых собержится более 50% всех нуклеотидов сборки

Знакомство с поисковыми системами ENA и NCBI

Для анализа был выбран белок коллаген - фибриллярный белок, составляющий основу соединительной ткани организма.

Для поиска в NCBI я использовала Advanced Search в базе данных Nucleotide:

Запрос collagen[Title]

Параметр поиска Количество записей
Всего записей 163,669
Гены с "collagen" в названии 3,998
Записи генов из GenBank 22,161
Записи генов из RefSeq 141,493
Записей мРНК из GenBank 16,206
Записей мРНК из RefSeq 137,542

Для последовательностей человека:

(collagen[Title]) AND Homo sapiens[Organism]

Тип последовательности Количество записей
genomic DNA/RNA из RefSeq 43
genomic DNA/RNA из GenBank 741
mRNA из RefSeq 696
mRNA из GenBank 2,476
Всего 3956

Поиск в ENA

Также использовался Advanced Search

Тип последовательности Поисковый запрос Количество записей
мРНК человека description="collagen" AND mol_type="mrna" 2557
Гены белков человека с collagen в названии tax_tree(9606) AND description="collagen" 294