Практикум 10. Выравнивание геномов

Построение нуклеотидного пангенома

Для работы были выбраны геномы 3 штаммов Bacillus subtilis.

Файл genomes.tsv:

all:embl:CP058242.1	SP	chr	c	Bacillus subtilis str. SP1
all:embl:CP016894.1	HJ	chr	c	Bacillus subtilis str. HJ0-6
all:embl:CP016767.1	CW	chr	c	Bacillus subtilis str. CW14

Были выполнены команды:

npge -g npge.conf
npge Prepare //log
npge Examine //log

Файл с рекомендованными параметрами
Исправленные параметры: WORKERS = 1, MIN_IDENTITY = 0,84 (npge.conf)

npge MakePangenome //log
npge PostProcessing //log

Выходные файлы:

Стабильное ядро нуклеотидного пангенома

Описание крупных делеций

Таблица 1.
Штамм Имя блока Длина делеции Имена генов
SP1 h2x7030 7030 8218 CDS BSHJ0_03813 CDP-ribitol ribitolphosphotransferase (HJ), 1860 bp <
8216 CDS BSHJ0_03811 Ribitol-5-phosphate 2-dehydrogenase (HJ), 1026 bp <
11923 CDS BCV50_15785 2-C-methyl-D-erythritol 4-phosphate (CW), 714 bp <
11924 CDS BCV50_15790 CDP-glycerol--glycerophosphate (CW), 1152 bp <
HJ0-6 h2x4886 4886 11927 CDS BCV50_15805 CDP-glycerol--glycerophosphate (CW), 1185 bp >
11928 CDS BCV50_15810 glycosyl transferase family A (CW), 1338 bp >
3833 CDS HWV68_19165 poly(glucosyl N-acetylgalactosamine 1-phosphate) (SP), 2703 bp >
CW14 h2x15208 15208 7221 CDS BSHJ0_02816 Histidine kinase (HJ), 1299 bp <
2856 CDS HWV68_14280 sulfite exporter TauE/SafE family protein (SP), 786 bp <
7227 CDS BSHJ0_02822 UPF0721 transmembrane protein YrkJ (HJ), 789 bp <

Перестановка синтений в g-блоках

С помощью команды qnpge было визуализировано расположение блоков. Были найдены приведенные на рисунке 1 перестановки g-блоков. Можно видеть (Рис. 1), что у штамма HJ0-6 блок g3x5051 переместился. Кроме того, на данном участке ни один g-блок не стоит в столбец из трех одинаковых, а отдельные g-блоки, гомологичные представленным, находятся в разных концах генома.

Рисунок 1.