Выравнивание геномов

|На главную|

|Обо мне|

|Семестры|

|Заметки|

|Ссылки|

Построение нуклеотидного пангенома

Были выбраны геномы штаммов Bacillus subtilis: Bacillus subtilis str. SP1 (CP058242.1), Bacillus subtilis str. HJ0-6 (CP016894.1), Bacillus subtilis str. CW14 (CP016767.1)

Был создан файл genomes.tsv для дальнейшей обработки командами ниже

Команды
npge -g npge.conf Cоздать файл с параметрами, которые можно изменить (WORKERS = 1)
npge Prepare &> log_prepare Скачать и переименовать геномные ДНК (log_prepare)
npge Examine Создать файл identity_recommended.txt с оценкой сходства геномов, чтобы затем изменить параметр MIN_IDENTITY на 0.84:
npge MakePangenome &> log_make После изменений параметров запустить построение нуклеотидного пангенома (параметр MIN_REL_DISTANCE = Decimal('0.001')): (log_make)
npge PostProcessing Создать файлы с аналитической информацией о пангеноме:

Итоговые файлы:

Дерево геномов: nj-global-tree.tre

Описание генов: features.bs

Описание всех мутаций в блоках: mut.tsv

Консенсусы всех блоков: consensuses.fasta

Описание блоков: pangenome.info

Выравнивания: pangenome.bs

Таблица характеристик блоков: pangenome.bi

Стабильное ядро нуклеотидного пангенома

Число s-блоков: 483

Размер нуклеотидного ядра (процент нуклеотидов в ядре от общего числа): 84.66%

Процент числа колонок в объединенном выравнивании s-блоков от суммарного числа колонок во всех блоках: 72.86%

Процент консервативных колонок в объединённом выравнивании s-блоков: 93,0735%

Описание крупных делеций

Штамм Имя блока Длина делеции Имена генов
SP1 h2x6597 6597
8195 CDS BSHJ0_03790 Dolichyl-phosphate beta-D-mannosyltransferase (HJ), 1905 bp <
11941 CDS BCV50_15875 glycosyltransferase (CW), 1905 bp <
11940 CDS BCV50_15870 N-acetylmuramoyl-L-alanine amidase (CW), 1488 bp <
			
HJ0-6 h2x1908 1908
922 CDS HWV68_04620 TetR family transcriptional regulator (SP), 618 bp <
10425 CDS BCV50_08295 TetR family transcriptional regulator (CW), 618 bp <
925 CDS HWV68_04625 MFS transporter (SP), 1254 bp <
			
CW14 h2x14255 14255
2214 CDS HWV68_11070 hypothetical protein (SP), 915 bp <
6320 CDS BSHJ0_01915 SPBc2 prophage-derived uncharacterized protein (HJ), 915 bp <
2213 CDS HWV68_11065 ATP-binding protein (SP), 972 bp < 
			

Перестановка синтений в g-блоках

Для того, чтобы узнать, какие перестановки синтений (g-блоков) произошли была использована утилита qnpge, которая визуализировала расположение блоков. В качестве примера синтении можно увидеть блок g3x282 у штамма CW14 блок g3x282 переместился с 72 позиции на 118 по-сравнению с другими штаммами.

© Belov Leonid, 2013