Банки нуклеотидных последовательностей
Характеристика качества сборки генома эукариота
Я выбрал объект со следующим таксономическим положением:
- Eukaryota
- Viridiplantae
- Chlorophyta
- Chlorophyceae
- Chlamydomonadales
- Chlamydomonadaceae
- Chlamydomonas
- Chlamydomonas asymmetrica
Для данного организма есть тольк одна
сборка
уровня "Scaffold". У сборки имеется один
проект
и один
образец.
Рассмотрим подробнее
BioSample:
- Accession number: SAMD00049914
- Организм: Chlamydomonas asymmetrica
- Имя образца: NIES-2207
- Название проекта: геномный анализ видов Хламидомонад
- Описание: Keywords: GSC:MIxS;MIGS:4.0
- BioProject: PRJDB4711 Chlamydomonas
И теперь
BioProject
- Accession number: PRJDB4711
- Тип данных: Сборка и секвенирование генома
- Организм: Chlamydomonas
- Актуальность: эволюция
- Количество объектов: 4
Перейдем к
сборке
нашего организма.
- Уровень сборки: Scaffold
- Представленность генома: полная
- WGS проект:
BDDA01
- Размер генома: 141,916 Мб
- Число скэффолдов: 4102
- N50 скэффолдов: 114158
- L50 скэффолдов: 360
- Число контигов: 14534
- N50 контигов: 22718
- L50 контигов: 1696
- Длина наибольшего скэфолда: 888611
- Длина наименьшего скэфолда: 1000
Файл с таблицей длин скэффолдов и их ID.
Последовательность одного из скэффолдов в fasta-формате. В
WGS-проекте
скэффолды названы контигами, соответственно, данных о контигах там нет,
поэтому некоторые величины даны только по скэффолдам.
Описание 10 ключей (Feature Key), используемых в таблицах
особенностей
Feature key: | Определение: | Пример:
|
centromere | экспериментально охарактеризованный регион, описанный как центромера |
|
D_segment | разнообразные сегменты тяжелой цепи иммуноглобулина и бета-цепь рецептора Т-клеток |
|
exon | область генома, кодирующая части и, р и тРНК, которые останутся, после сплайсинга |
|
gap | пробел в последовательности |
|
iDNA | промежуточная ДНК; ДНК, которая удаляется посредством любого типа рекомбинации |
|
misc_binding | сайт в нуклеиновой кислоте, ковалентно или нековалентно связанный с другим участком, который не может быть описан никаким другим ключом связывания |
|
mobile_element | область генома, содержащая мобильный элемент |
|
modified_base | указанный нуклеотид является модифицированным и должен быть заменен на указанную молекулу |
|
mRNA | информационная РНК, включая 5'нетранслируемый участок, кодирующий фрагмент и 3'нетранслируемый участок |
|
polyA_site | сайт на транскрибированной РНК, к которому будет добавлены аденины во время посттранскрипционного полиаденилирования |  |
Описание состояния дел в геномном проекте
Я бы хотел рассказать о
проекте
по изучению 1000 геномов грибов. Грибы, насчитывая около 1,5 миллионов видов,
представляют одну из крупнейших ветвей "Древа Жизни". Их влияние на хозяйство
людей и экосистему в целом очень велико. Они являются и патогенами, и симбионтами,
и редуцентами. Они способны разлагать практически любой биополимер, таких
возможностей нет даже у бактерий. Но использование грибов на благо человеку
требует точного понимания, как они взаимодействуют в естественных и искусственных
сообществах.
Проект был рассчитан на 5 лет. Начался он
7 ноября 2011 года. Рассчитывалось взять по 2 вида из 500 различных семейств грибов.
Цель проекта - заполнить пробелы в "Древе Жизни" грибов, а в дальнейшем предоставлять
справочную информацию исследователям. Проект проводит международная исследовательская
группа в сотрудничестве с Joint Genome Institute министерства энергетики (США). К данному
моменту проект почти завершен. Один из последних
релизов
был 17 октября 2016 года.
Таблица митохондриальных генов организма отдела Rhodophyta
Поиск проводил по запросу
(("Rhodophyta"[Organism] AND mitochondrion[Title]) AND complete[Title]) AND (genome[All Fields] OR sequence[All Fields]).
Было обнаружено
94 результата
, из них 60 - в GenBank, 34 - в RefSeq.
Выбрал
митохондриальный геном
Porphyra purpurea. У порфиры 29
митохондриальных генов.
Данные были занесены в
таблицу.

Таблица длин геномов разных таксонов
| Минимальный, пн | Типичный, пн | Максимальный, пн
|
Вироиды | 120 (Avocado sunblotch viroid) | 300 | 475(Citrus exocortis viroid isolate D-104)
|
Вирусы, бактериофаги | 220(Rice yellow mottle virus satellite) | 4000 | 2473870(Pandoravirus salinus)
|
Бактерии, археи | 72073(Acinetobacter baumannii) | 5000000 | 14782125 ( Sorangium cellulosum)
|
Эукариоты | 662517(Corbicula fluminea) | 40000000 | 27602653187(Pinus lambertiana) |
© Maximov Vladislav, 2019.