В качестве интересующего организма был выбран нелетающий попугай какапо (лат.Strigops habroptilia, англ. Kakapo). У данных птиц в базе данных NCBI имеется 2 сборки генома: выбранная (сборка до уровня хромосом) и сборка на уровне Scaffold(*). Сборка на уровне хромосом означает, что некоторые хромосомы не собраны до конца, (что не позволяет стать этой сборке полной). Сборка была найдена по видовому названию.
* scaffold -- не связанные между собой контиги, получившиеся при сборке; контиг -- участки генома, полученные объединением перекрывающихся ридов.
Референсная сборка -- лучшая сборка из представленных (что включает в себя аннотацию, лучшее качество сборки, экспериментальные данные и т.д), либо в силу исторических причин выбранная как стандарт для данного вида.
Репрезентативная сборка -- в случае, если отсутствует референсная сборка, выбирается репрезентативная на основании многих причин: ее выбрали вручную, длина геномной сборки наименее отклоняется от предсказанной, наибольшей процент полноты и др. [1]
Данная сборка является референсной.
В данной таблице приведены основные характеристики выбранной сборки генома какапо.
GenBank ID | RefSeq ID | Размер генома | Scaffold N50 | Scaffold L50 | Number of scaffolds | Contig N50 | Contig L50 | Number of contigs | ||||||||
GCA_004027225.2 | GCF_004027225.2 | 1.1 Gb | 83.2 Mb | 6 | 89 | 9.5 Mb | 40 | 456 |
Параметр N50 означает длину контига, для которого 50% всех нуклеотидов сборки содержится в контигах/скаффолдах такой или большей длины. Параметр L50 означает наименьшее количество контигов/скаффолдов, в которых содержится 50% всех нуклеотидов сборки.
I don't know how to make footer properly. You may as well pretend you haven't seen this phrase!