Анализ сборки эукариотического генома

Используя базы данных NCBI и другие, подробно охарактеризовать геномную сборку.

Otocolobus manul или The Pallas's cat - манул, если по-русски

-

Семь килограмм безумного очарования

Задание 1

Я выбрала как организм манула из-за их вечнонедовольного характера и кучи связанных мемов. К счастью, сборка генома имеется, и довольно приличная.

Ищу по латинскому названию в NCBI, выдает две сборки:

Выдача NCBI

У манулов 38 хромосом, в моей сборке лежит гаплоидный геном, имеется 23 скаффолда. Уровень референсной сборки GCA_028564725.2 - Chromosome (это ниже, чем геномный, но тоже хорошо). Вторая сборка - вторая часть гаплоидного генома, но там качество хуже. Материал взяли из клеток крови 5-летнего кота, в сборку входит Y-хромосома, секвенировали нанопором.

Сборка репрезентативная - это означает, что она подходит для понимания организации генома этого вида, но недостаточна хороша, чтобы считаться образцовой.

Два манул

Задание 2

Информация о выбранной сборке
ХарактеристикаЗначение
Идентификатор GenBankGCA_028564725.2
Идентификатор RefSeq-
Общий размер генома2.5 Gb
Scaffold N50151.9 Mb
Scaffold L507
Contig N50118.2 Mb
Contig L508

N50 - длина контига, с учетом которого все бОльшие покрывают половину сборки. Мне кажется, это маловато, геном аж в 16 раз больше длины контига, и нанопор позволяет секввенировать более длинные последовательности.

L50 - номер этого контига (упорядочены по длине от большего к меньшему), то есть минимальное количество контигов, покрывающих половину генома. В совокупности эти данные свидетельствуют, что имеются 7 контигов размера 150-200 мегабаз, все остальные меньше.

Информация взята отсюда.