Нуклеотидные базы данных

Задание 1. Сборка генома эукариотического организма

Рисунок 1. Acanthamoeba healyi

В первом задании требовалось охарактеризовать сборку выбранного организма: в моем случае - Acanthamoeba healyi (см рис.1 - источник: [0]). Это эукариот из группы Amoebozoa (полную систематику можно посмотреть по ссылке [1]), может становиться причиной гранулематозного амебного энцефалита в человеке ([2]). Некоторые параметры, характеризующие сборку приведены ниже - в таблице 1.

число сборок генома1
число проектов по секвенированию организма и число образцов1 проект, 1 образец
описание образцаBIOSAMPLE ID: SAMEA3111749 (описание отсутствует)
описание проектаBIOPROJECT: PRJEB7687. Цель проекта - выяснение филогении акантамеб.
число контигов/скэффолдов сборки 28,326/26,188
ссылка на таблицу контигов/скэффолдовтаблица
N50 и L507,871 и 2,434
самый длинный и самый короткий контиг64 и 120,464 b. p.
ссылка на последовательность одного из контиговссылка

Таблица 1. Характеристика сборки

Задание 2. Описание различных ключей

В этом задании надо было описать смысл и привести пример использования семи различных ключей. Данные я брала со страницы INSDC [3], результат можно также посмотреть в таблице 2.

КлючЧто обозначаетПример
mobile_elementОбласть генома, содержащая мобильный элемент.
polyA_siteСайт на РНК-транскрипте, к которому будут добавлены аденины в ходе посттранскрипционного полиаденилирования, у эукариот и вирусов эукариот.
S_regionПереключающая последовательность тяжелой цепи иммуноглобулина. Вовлечена в перестраивание последовательности (изменение на другие С-гены) тяжелой цепи ДНК, приводящее к синтезу другого класса иммуноглобулинов.
stem_loopШпилька - двойную спираль из одной цепи ДНК или РНК.
sig_peptideСигнальный пептид: N-концевой домен секретируемых белков, который участвует во взаимодействии белка с мембранами.
V_segmentВариабельная часть легкой или тяжелой цепи иммуноглобулинов, а также альфа, бета и гамма цепи Т-клеточных рецепторов.
3'UTRОбозначает либо нетранслируемый участок на 3'-конце зрелого транскрипта (после стоп-кодона), либо нетранслируемый участок на 3'-конце вирусной РНК (после последнего стоп-кодона).

Таблица 2. Описание ключей

Задание 3. Описание состояния геномного проекта.

Выбранный мной проект - The NBRC Whole Genome Shotgun Project (NBRC - The National Board for Respiratory Care). Его цель - получить референсные геномы штаммов, содержащихся в коллекции NBRC, для идентификации полезных для таксономии генов, для оценки опасности штамма, индустриального применения, а также для понимания структуры и эволюционирования данных геномов. Проект начался в 2012 году, к настоящему моменту опубликовано 490 геномов. Данные они публикуют в разных базах данных (например в DDBJ и в GenBank, впрочем, записи дублируют друг друга).

У проекта есть собственная страница ([4]), на сайте института, выполяющего этот проект: National Institute of Technology and Evaluation Biological Resource Center (Япония), однако он давно не обновлялся, поэтому я использовала поиск в базе данных BioProject, чтобы узнать последние обновления. Поиск осуществлялся по строчке из описания проекта.

Задание 4. Поиск митохондриальных генов организма

В этом задании надо было правильно составить запрос, чтобы найти записи, соответствующие полному митохондримальному геному выбранного организма - Saccharomyces eubayanus strain FM1318, а затем состаивть таблицу митохондриальных генов.

Для составления запроса я использовала обозначения из таблицы с NCBI. Получившийся запрос: (complete genome[TI] OR complete sequence[TI] ) AND mitochondrion[FILT] AND (srcdb_genbank[PROP] OR srcdb_refseq[PROP]) Saccharomyces eubayanus[ORGN] - я не писала штамм в организме, поскольку других там не было. Информация о генах, представленная в таблице 3, была получена при переходе по ссылке Gene в разделе Related information (ссылка на сам геном2).

tax_idOrg_nameGeneIDStatusAliasesdescriptionother_designationschromosome
1080349Saccharomyces eubayanus28934775liveDI49_5639DI49_5639saccharomyces cerevisiae ortholog: Q0130saccharomyces cerevisiae ortholog: Q0130|OLI1-like proteinMT
1080349Saccharomyces eubayanus28934776liveDI49_5640DI49_5640saccharomyces cerevisiae ortholog: Q0140saccharomyces cerevisiae ortholog: Q0140|VAR1-like proteinMT
1080349Saccharomyces eubayanus28934797liveDI49_5661DI49_5661saccharomyces cerevisiae ortholog: Q0250saccharomyces cerevisiae ortholog: Q0250|COX2-like proteinMT
1080349Saccharomyces eubayanus28934801liveDI49_5665DI49_5665saccharomyces cerevisiae ortholog: Q0275saccharomyces cerevisiae ortholog: Q0275|COX3-like proteinMT
1080349Saccharomyces eubayanus28934803liveDI49_5667DI49_5667saccharomyces cerevisiae ortholog: Q0105saccharomyces cerevisiae ortholog: Q0105|COB-like proteinMT
1080349Saccharomyces eubayanus28934807liveDI49_5671DI49_5671saccharomyces cerevisiae ortholog: Q0110saccharomyces cerevisiae ortholog: Q0110|BI2-like proteinMT
1080349Saccharomyces eubayanus28934808liveDI49_5672DI49_5672saccharomyces cerevisiae ortholog: Q0045saccharomyces cerevisiae ortholog: Q0045|COX1-like proteinMT
1080349Saccharomyces eubayanus28934809liveDI49_5673DI49_5673saccharomyces cerevisiae ortholog: Q0080saccharomyces cerevisiae ortholog: Q0080|ATP8-like proteinMT
1080349Saccharomyces eubayanus28934810liveDI49_5674DI49_5674saccharomyces cerevisiae ortholog: Q0085saccharomyces cerevisiae ortholog: Q0085|ATP6-like proteinMT

Таблица 3. Митохондриальные гены



НАЗАД ➜
© <Рюмина Екатерина>, 2017