Нуклеотидные банки данных

Для данного задания я выбрал геномную сборку организма Garra rufa (рис. 1). Для поиска я использовал фильтр, чтобы сборка была 2025 года и уровня выше Chromosome. Было найдено много результатов. Просмотрев некотрые из них, я выбрал именно эту рыбку, так как про неё было указано, что у неё больше 50 % генов кодируют малые РНК (таких генов больше чем тех, которые кодируют белки. Для меня это показалось необычным). Ниже, в таблице 1, приведена информация о некоторых характеристиках этой сборки.

Таблица 1. Характеристики сборки
Идентификатор GenBank GCA_049309525.1
Идентификатор RefSeq GCF_049309525.1
Уровень сборки генома Chromosome
Общий размер генома (п.н.) 1,4 Gb
Число хромосом 25
Число скэффолдов 1 000
Scaffold N50 49,3 Mb
Scaffold L50 12
Число контигов 15 924
Contig N50 132,1 kb
Contig L50 3 054
Fish
Рисунок 1. Изображение рыбы Garra rufa

Уровень сборки Chromosome озночает, что существует последовательность одной или нескольких хромосом. Это может быть полностью секвенированная хромосома без пробелов, или хромосома, содержащая скэффолды или контиги с пробелами между ними. Также могут быть неразмещённые или нелокализованные скэффолды.

Указано, что хромосом 25. На самом деле у этой рыбы 50 хромосом (2n набор), то есть 25 пар хромосом, что говорит о хорошем качестве сборки.

Сборка генома была указана там же, где производился поиск эукариота (в колонке Assembly).

L50 - число контигов (скэффолдов) (наименьшее), в которых содержится половина (50%) всех нуклеотидов сборки.

N50 - длина контига (скэффолда), для которого половина (50%) всех нуклеотидов сборки содержится в контигах (скэффолдах) такой и большей длины.

Также были скачаны файлы с геномом этого организма, а также всеми его белками (на локальный компьютер).

Знакомство с поисковыми запросами в NCBI

Мною был выбран белок пепсин. Далее приведены запросы и описание того, что они находят.

Не все записи содержат последовательность именно пепсина. Есть его предшественики.

Знакомство с поисковыми запросами в ENA

Необходимо было составить два запроса:

Эта система поиска мне понравилась меньше. Для меня она менее понятная и не слишком интуитивная.

Знакомство с поисковыми запросами в DDBJ

Необходимо было составить два запроса:

Эта система поиска мне понравилась немного больше, чем в ENA, но всё ещё меньше, чем NCBI.