Практикум №7

Задание 1

Я искал собаку, поисковым запросом был "Canis lupus familiaris", по запосу нашлось 21 находка, но только одна сборка была референсной, ее я и взял: Genome assembly UU_Cfam_GSD_1.0.(причем это оказалась немецкая овчарка). Хромосом у нее, как и у других собак, соответственно, 78. Уровень сборки - Chromosome, это означает, что дана последовательность для одной или многих хромосом. Это может быть полностью секвенированная хромосома без гэпов или хромосома, содержащая скаффолды или контиги с гэпами между ними. Также могут быть нелокализованные скаффолды. То, что сборка референсная означает, что это вручную отобранная качественная сборка, которая выбрана как стандрартная в сравнении с другими данными.

Задание 2

Идентификатор GenBank GCA_011100685.1
Идентификатор RefSeq GCF_011100685.1
Общий размер генома 2 481 983 352
Scaffold N50 64 299 765
Scaffold L50 15
Contig N50 14 840 767
Contig L50 57
N50 (для контигов) -длина контига, для которого половина (50%) всех нуклеотидов сборки содержится в контигах такой и большей длины, другими словами расставляем в порядке увеличения размеров контиги, отмеряем 50% нуклеотидов от самоного большого, и тот на котором остановились и есть N50
L50 (для контигов) - упорядочиваем по длине контиги, отсчитываем 50 % нуклеотидов начиная с самого большого, и все, что попали на границу 50 %. те составляют число L50
Аналогично для скаффолдов

Задание 3

Для дальнейшей работы скачал:
Нуклеотидные последовательности генома (в формате FASTA);
Последовательности белков (в формате FASTA);
Последовательности генома с аннотацией (GBFF)