Практикум 10. Выравнивание геномов

1. Выбор геномов

Были выбраны 3 штамма бактерии Bacillus subtillis. Все геномы имеют одну полностью собранную хромосому и не содержат плазмид.

  1. Bacillus subtilis CW14: CP016767.1
  2. Bacillus subtilis MB8_B1: CP045823.1
  3. Bacillus subtilis MB9_B1: CP045820.1

2. Выравнивание с использованием программы NPG Explorer

Последовательно были запущены программы:

npge -g npge.conf
npge Prepare
npge Examine

На основании результатов работы программы npge Examine в файле npge.conf параметр MIN_IDENTITY был изменен на 0.842.

npge MakePangenome
npge PostProcessing
qnpge

    Ссылки на основные полученные файлы

    1. nj-global-tree.tre
    2. pangenome.bi
    3. pangenome.info
    4. npge Prepare log
    5. npge Examine log
    6. npge MakePangenome log
    7. npge PostProcessing log

    3. Стабильное ядро пангенома

    1. Число s-блоков: 483
    2. Процент нуклеотидов в ядре от числа нуклеотидов во всех геномах s-блоков: 85.76%
    3. Процент консервативных колонок в объединённом выравнивании s-блоков: 93.23%

    4. Крупные делеции

    Крупные делеции были проанализированны с использованием программы Excel. Были выбраны только h2 блоки, не содержащие фрагментов из одного из геномов, затем они были отсортированы по длине и с помощью qnpge были определены гены, которые они содержат. Самая крупная делеция в геноме CW14 40867 нуклеотидов, что достаточно много, большая часть генов представляют собой hypothetical protein и не представлены в таблице.

    Геном Имя блока Длина делеции Делетированные гены
    CW14 h2x40867 40867

    11024 CDS GII79_11355 DNA-binding protein (MB8B1), 276 bp

    11025 CDS GII79_11360 hypothetical protein (MB8B1), 1254 bp

    11050 CDS GII79_11485 tyrosine-type recombinase/integrase (MB8B1), 1002 bp

    11051 CDS GII79_11490 helix-turn-helix domain-containing protein (MB8B1), 336 bp

    11053 CDS GII79_11500 phage tail tape measure protein (MB8B1), 6894 bp

    11054 CDS GII79_11505 phage tail protein (MB8B1), 762 bp

    11058 CDS GII79_11525 N-acetylmuramoyl-L-alanine amidase family (MB8B1), 1068 bp

    11060 CDS GII79_11535 phage holin (MB8B1), 252 bp

    MB8_B1 h2x1283 1283 6376 CDS GII81_10320 tyrosine-type recombinase/integrase (MB9B1), 1140 bp
    MB9_B1 Делеций не обнаружено - -

    5. Перестановки синтений

    Из рисунка ниже видно, что в геноме CW14 несколько g-блоков (g3x120, g3x133, g3x5488) поменяли свои места относительно других геномов.