Главная
Семестры
Обо мне
Ссылки

Банки нуклеотидных последовательностей

Характеристика качества сборки генома эукариота

Я выбрал объект со следующим таксономическим положением:
  • Eukaryota
  • Viridiplantae
  • Chlorophyta
  • Chlorophyceae
  • Chlamydomonadales
  • Chlamydomonadaceae
  • Chlamydomonas
  • Chlamydomonas asymmetrica
Для данного организма есть тольк одна сборка уровня "Scaffold". У сборки имеется один проект и один образец.
Рассмотрим подробнее BioSample:
  • Accession number: SAMD00049914
  • Организм: Chlamydomonas asymmetrica
  • Имя образца: NIES-2207
  • Название проекта: геномный анализ видов Хламидомонад
  • Описание: Keywords: GSC:MIxS;MIGS:4.0
  • BioProject: PRJDB4711 Chlamydomonas
И теперь BioProject
  • Accession number: PRJDB4711
  • Тип данных: Сборка и секвенирование генома
  • Организм: Chlamydomonas
  • Актуальность: эволюция
  • Количество объектов: 4
Перейдем к сборке нашего организма.
  • Уровень сборки: Scaffold
  • Представленность генома: полная
  • WGS проект: BDDA01
  • Размер генома: 141,916 Мб
  • Число скэффолдов: 4102
  • N50 скэффолдов: 114158
  • L50 скэффолдов: 360
  • Число контигов: 14534
  • N50 контигов: 22718
  • L50 контигов: 1696
  • Длина наибольшего скэфолда: 888611
  • Длина наименьшего скэфолда: 1000
Файл с таблицей длин скэффолдов и их ID. Последовательность одного из скэффолдов в fasta-формате. В WGS-проекте скэффолды названы контигами, соответственно, данных о контигах там нет, поэтому некоторые величины даны только по скэффолдам.

Описание 10 ключей (Feature Key), используемых в таблицах особенностей

Feature key: Определение: Пример:
centromere экспериментально охарактеризованный регион, описанный как центромера
D_segment разнообразные сегменты тяжелой цепи иммуноглобулина и бета-цепь рецептора Т-клеток
exon область генома, кодирующая части и, р и тРНК, которые останутся, после сплайсинга
gap пробел в последовательности
iDNA промежуточная ДНК; ДНК, которая удаляется посредством любого типа рекомбинации
misc_binding сайт в нуклеиновой кислоте, ковалентно или нековалентно связанный с другим участком, который не может быть описан никаким другим ключом связывания
mobile_element область генома, содержащая мобильный элемент
modified_base указанный нуклеотид является модифицированным и должен быть заменен на указанную молекулу
mRNA информационная РНК, включая 5'нетранслируемый участок, кодирующий фрагмент и 3'нетранслируемый участок
polyA_site сайт на транскрибированной РНК, к которому будет добавлены аденины во время посттранскрипционного полиаденилирования

Описание состояния дел в геномном проекте

Я бы хотел рассказать о проекте по изучению 1000 геномов грибов. Грибы, насчитывая около 1,5 миллионов видов, представляют одну из крупнейших ветвей "Древа Жизни". Их влияние на хозяйство людей и экосистему в целом очень велико. Они являются и патогенами, и симбионтами, и редуцентами. Они способны разлагать практически любой биополимер, таких возможностей нет даже у бактерий. Но использование грибов на благо человеку требует точного понимания, как они взаимодействуют в естественных и искусственных сообществах. Проект был рассчитан на 5 лет. Начался он 7 ноября 2011 года. Рассчитывалось взять по 2 вида из 500 различных семейств грибов. Цель проекта - заполнить пробелы в "Древе Жизни" грибов, а в дальнейшем предоставлять справочную информацию исследователям. Проект проводит международная исследовательская группа в сотрудничестве с Joint Genome Institute министерства энергетики (США). К данному моменту проект почти завершен. Один из последних релизов был 17 октября 2016 года.

Таблица митохондриальных генов организма отдела Rhodophyta

Поиск проводил по запросу (("Rhodophyta"[Organism] AND mitochondrion[Title]) AND complete[Title]) AND (genome[All Fields] OR sequence[All Fields]). Было обнаружено 94 результата , из них 60 - в GenBank, 34 - в RefSeq. Выбрал митохондриальный геном Porphyra purpurea. У порфиры 29 митохондриальных генов. Данные были занесены в таблицу.


Таблица длин геномов разных таксонов

Минимальный, пн Типичный, пн Максимальный, пн
Вироиды 120 (Avocado sunblotch viroid) 300 475(Citrus exocortis viroid isolate D-104)
Вирусы, бактериофаги 220(Rice yellow mottle virus satellite) 4000 2473870(Pandoravirus salinus)
Бактерии, археи 72073(Acinetobacter baumannii) 5000000 14782125 ( Sorangium cellulosum)
Эукариоты 662517(Corbicula fluminea) 40000000 27602653187(Pinus lambertiana)