Практикум №7

1) Выбор качественной сборки генома эукариотического организма

Я наткнулась на новость "Очень пухлая ехидна выжила в ДТП и стала звездой Сети" и подумала, что это знак и нужно выбрать австралийскую ехидну (лат. Tachyglossus aculeatus) для этого практикума.

pic1

У Tachyglossus aculeatus 36 пар хромосом.

Поисковый запрос был банален: Tachyglossus aculeatus (Australian echidna)

Было найдено 3 сборки. Я выбрала референсную сборку (GCA_015852505.1) - это означает, что данную сборку сотрудники NCBI вручную выбрали как высококачественную и лучшую из всех представленных. Выбранная сборка имеет уровень хромосомной, то есть в этой сборке присутствует последовательность одной или более хромосом, при том, что в этой последовательности могут быть пробелы.

2) Характеристики выбранной сборки

Таблица 1. Некоторые характеристики выбранной сборки.

pic2

N50 - длина контига/скэффолда для которого половина от всех контигов/скэффолдов такой же или большей длины.

L50 - минимальное количество контигов/скэффолдов в которых находится половина нуклеотидов сборки.

3) Загрузка файлов

Я скачала из GenBank нуклеотидные последовательности генов в формате FASTA, последовательности белков (FASTA), генома с аннотацией (GBFF).