Практикум 7

Эукариотический организм: Caenorhabditis elegans

Табл.1 Характеристики выбранной сборки
Идентификатор GenBank GCA_000002985.3
Идентификатор RefSeq GCF_000002985.6
Уровень сборки генома Complete Genome
Общий размер генома (п.н.) 100.3 Mb
Число скэффолдов 6
Число контигов 6
Scaffold N50 17.5 Mb
Scaffold L50 3
Contig N50 17.5 Mb
Contig L50 3

Пояснение для Scaffold
L50 В 3 скэффолдах содержится 50% нуклеотидов сборки
N50 Длина наименьшего скэффолда из них равна 17.5 Mb

Пояснение для Contig
L50 «Разрежем» скэффолды по участкам NNN… и получим 6 контигов, в 3 из которых содержится 50% нуклеотидов сборки
N50 Длина наименьшего из них 17.5 Mb

Работа с поисковыми системами ENA и NCBI
NCBI

Название белка: Tropomyosin

2,455 записей нуклеотидных баз данных посвящено генам и 40,443 мРНК белков со словом Tropomyosin в названии.

7,635 из них — из GenBank, 36,162 - из RefSeq


Для последовательностей человека: мРНК - 952, участки генома - 26; из GenBank - 901 и из RefSeq - 105.

Не все из записей действительно содержат последовательности, кодирующие белки с соответствующей функцией, некоторые записи содержат гипотетические или предсказанные белки, где функция может быть не подтверждена, и обозначаются как PREDICTED.

ENA

Количество записей, описывающих мРНК человека: 1013, гены - 15.

DDBJ

Количество записей, описывающих мРНК человека: 1011, гены - 12.

Для поиска информации по названию белка я скорее использую NCBI, так как там более удобный интерфейс и проще ориентироваться, также больше параметров для поиска и содержит больше записей