Сборка генома и ее характеристики

В качестве интересующего организма был выбран нелетающий попугай какапо (лат.Strigops habroptilia, англ. Kakapo). У данных птиц в базе данных NCBI имеется 2 сборки генома: выбранная (сборка до уровня хромосом) и сборка на уровне Scaffold(*). Сборка на уровне хромосом означает, что некоторые хромосомы не собраны до конца, (что не позволяет стать этой сборке полной). Сборка была найдена по видовому названию.

:(
Рис 1. Попугаи какапо (фото из Википедии)

* scaffold -- не связанные между собой контиги, получившиеся при сборке; контиг -- участки генома, полученные объединением перекрывающихся ридов.

Референсная сборка -- лучшая сборка из представленных (что включает в себя аннотацию, лучшее качество сборки, экспериментальные данные и т.д), либо в силу исторических причин выбранная как стандарт для данного вида.

Репрезентативная сборка -- в случае, если отсутствует референсная сборка, выбирается репрезентативная на основании многих причин: ее выбрали вручную, длина геномной сборки наименее отклоняется от предсказанной, наибольшей процент полноты и др. [1]

Данная сборка является референсной.

В данной таблице приведены основные характеристики выбранной сборки генома какапо.

GenBank ID RefSeq ID Размер генома Scaffold N50 Scaffold L50 Number of scaffolds Contig N50 Contig L50 Number of contigs
GCA_004027225.2 GCF_004027225.2 1.1 Gb 83.2 Mb 6 89 9.5 Mb 40 456

Параметр N50 означает длину контига, для которого 50% всех нуклеотидов сборки содержится в контигах/скаффолдах такой или большей длины. Параметр L50 означает наименьшее количество контигов/скаффолдов, в которых содержится 50% всех нуклеотидов сборки.

  1. https://www.ncbi.nlm.nih.gov/refseq/about/prokaryotes/

I don't know how to make footer properly. You may as well pretend you haven't seen this phrase!

↩ К странице семестров