Выравнивание геномов

Выбор бактерии

Для рассмотрения были выбраны 3 штамма Gimesia chilikensis: HG66A1, MaMl14, V6. Для загрузки и дальнейшего анализа геномов был подготовлен единственный входной файл genomes.tsv.

Построение нуклеотидного пангенома с помощью NPG-explorer

Для построения НПГ воспользовались следующими командами:
npge Prepare &> log_prepare - созданы и переименованы геномные последовательности (log_prepare)
npge Examine &> log_examine - вычисление оценки сходства геномов (log_examine) и коррекция параметра MIN_IDENTITY по рекомендации npge Examine (0,899)
npge MakePangenome &> log_make - построение НПГ (log_make)
npge PostProcessing &> log_post - получение файлов с описанием пангенома (log_post)

Описание стабильного ядра нуклеотидного пангенома

Информацию о стабильном ядре можно найти в файле pangenome.info. Нуклеотидный пангеном включает в себя 1405 стабильный блок (s-blocks), размер же нуклеотидного ядра (процент нуклеотидов в ядре от числа нуклеотидов во всех геномах) составляет 80.39%. Процент консервативных колонок в объединённом выравнивании s-блоков составляет 94,51%.

Описание самой крупной делеции в каждом геноме

Для того, чтобы найти крупнейшие делеции в каждом геноме, были найденны наибольшие h-блоки, которые не встречаются в соответствующем геноме. Для этого был произведен поиск в файле pangenome.bi, открытом в программе LibreOffice Calc. Гены определялись с помощью интерфейса qnpge.

Табл. 1. Описание самой крупной делеции в каждом геноме
Штамм               Блок, подтверждающий делецию Длина делеции Выпавшие генов
HG66A1 h2x13412 13412 Doubled CXXCH motif, Adenylate cyclase 2, Iron-sulfur protein, PP2C-family Ser/Thr phosphatase
MalM14 h2x5779 5779 Matrixin
V6 h2x17505 17505 N,N'-diacetylchitobiose phosphorylase, SigmaW regulon antibacterial, Bestrophin, RFP-TM, chloride channel, CBS domain protein, Spermidine synthase

Описание перестановки синтений

Путем изучения графической информации, представленной в gnpge, был найден блок g3x158, претерпевший перестановку, в геноме штамма MaMl14

Аденин

Рис.1 . Перестановка блока g3x158.