Отчёт о крупных эволюционных событиях, на основе примеров, обнаруживаемых в геномах 4 штаммов Pseudomonas aeruginosa

Построение нуклеотидного пангенома с помощью NPG-explorer

Для выполнения задания была быбрана бактерия Pseudomonas aeruginosa(Синегно́йная па́лочка). Был составлен текстовый файл для создания пангенома genomes.tsv. Используя команды.

npgn Prepare, npgn MakePangenome, npgn PostProcessing

Файлы выдачи пангенома NPG-explorer:
  • nj-global-tree.tre дерево геномов, построенное на основе объединённого выравнивания s-блоков
  • features.bs с описаниями генов
  • mut.tsv с описанием всех мутаций в блоках
  • consensuses.fasta с консенсусами всех блоков
  • pangenome.info, pangenome.bs, pangenome.bi с блоками, т.е. выравниваниями
  • log_postprocessing, log_prepare, log_makepangenome с описаниями протоколов
  • Описание стабильного ядра нуклеотидного пангенома

    Информация о стабильном ядре нуклеотидного пангенома находится в файле pangenome.info.

    Число s-блоков509
    Размер нуклеотидного ядра (процент нуклеотидов в ядре от числа нуклеотидов во всех геномах)81.12%
    Процент консервативных колонок в объединённом выравнивании s-блоков98.6188%
    Длина построенных фрагментовmin:100
    max:167710

    Крупные делеция

    Были отобраны гены длиной больше 5000 с делецией с помощью информации из файла pangenome.bi


    ШтаммБлокДлинаГены с делецией
    Pseudomonas aeruginosa str. YTSEY8h3x75467546CDS C8257_12140 helix-turn-helix domain-containing protein
    Pseudomonas aeruginosa str. MRSN12280h3x65896589CDS HUF04_15935 aryl-sulfate sulfotransferase
    Pseudomonas aeruginosa str. CMC-097h3x70187018CDS C8257_26110 hypothetical protein
    Pseudomonas aeruginosa str. 1811-13R031h2x4997749977CDS IAU57_22655 efflux RND transporter permease subunit

    Перестановки синтений g-блока

    Информация была взята из файла blocks.blocks. Информация была перенесена в excel-таблицу. Блоки были подсвечены при повторении с помощью макроса, взятого с этого сайта https://www.planetaexcel.ru/techniques/14/198/. Пример перестановки можно видеть в g-блоке g4x294972 генома CMC-097. В геноме штамма CMC-097 g-блок g4x294972 оказался смещен на 25 блоков.