NPG

Построение нуклеотидного пангенома

Для работы были выбраны геномы 5 штаммов бактерии Lactobacillus acidophilus. После первых попыток запуска программы выяснилось, что геном штамма Lactobacillus acidophilus strain JBNU_C5 был не аннотирован, поэтому он был исключён из файла для корректной работы программы. Ознакомиться с остальными штаммами и записями об их сборке генома можно по данным из входного файла для программы.

Входной файл: genomes.tsv
Выходные файлы работы программ:

Стабильное ядро выравнивания

Выравнивание содержит 139 S-блоков. Размер нуклеотидного ядра (процент нуклеотидов в ядре от общего числа) 87.15%. Процент консервативных колонок 99.4477%.

Крупные делеции

Таблица 1.
Вид Имя блока Длина делеции Имена генов
YT1 h3x14072 14072 LA20079_00690, HUE89_02495, LA20079_00740
DSM-20079 h3x307 307 CGZ81_01970, HUE89_00385, CXB72_00500
DSM-20079 и YT1 h2x9393 9393 CGZ81_03190, HUE89_01590, CGZ81_03200

Интересным оказался тот факт, что во всём пангеноме для штаммов ATCC-53544 и LA-G80-111 не нашлось ни одной делеции. Все делеции относятся к штаммам DSM-20079 и YT1.

Перестановки g-блоков

В геномах обнаружена перестановка блока g4x108. При перестановке этот g-блоков инверсировался. В этом блоке во всех штаммах кроме LA-G80-111 расположен участок сигнального домена YSIRK.
Рисунок 1.