NPG
На данной странице представлен практикум по использованию алгоритмов NPG-explorer для анализа крупных геномных перестроек в бактериях одного штамма.
1) Построение нуклеотидного пангенома с помощью NPG-explorer:
Для построения нуклеотидного пангенома был использован соответсвующий пакет NPG-explorer, загруженный на кодомо. Для анализа были выбраны 5 штаммов Bacillus subtilis, чьи аннотированные геномы можно найти на ncbi. C входным файлом, содержащим информацию о данных штамах, можно ознакомиться по ссылке.
После выполнения Examine в файл npge.conf были внесены изменения, понижающие минимальную идентичность блоков с 0.9 до 0.839. Файл с протоколом процедуры доступен по ссылке.
2) Описание стабильного ядра нуклеотидного пангенома:
Информация о полученном пангеноме доступна в файле pangenome.info. Выдержка:
Дерево построенное на основании схожести геномов выбранных штаммов(рис.1) из данных, полученных NPG-explorer. Три нижних настолько близки, что почти не разделимы на дереве.
3) Описание крупных делеций:
Поиск делеций в каждом геноме проводился по анализу h-блоков в файле pangenome.bi. Тири выбранных штамма Bacillus subtilis (strain 168; strain BS34A; strain NCIB 3610) оказались настолько сходны, что ни разделяются на дереве, ни имеют h-блоков в пангеноме. Однако два других штамма имеют, их результаты в таблице:
Штамм B.subtilis | Имя блока: | Длина делеции: | Гены в блоке: |
---|---|---|---|
strain CW14 | h4x15209 | 15209 | BSU_26420 (two-component sensor histidine kinase); BSU_26430 (transcriptional regulator of two-component system); BSU_26440; BSU_26450; BSU_26470 (NAD(P)H oxidoreductase); BSU_26480; BSU_26490; BSU_26500; BSU_26510; BSU_26530; BSU_26540; BSU_26550; BSU_26560; BSU_26580; BSU_26590 |
strain MB9_B1 | h4x6826 | 6826 | BSU_39230 (wall-associated protein) |
subsp. subtilis str. 168 | - | - | - |
strain BS34A | - | - | - |
strain NCIB 3610 | - | - | - |
Названия генов даны по штамму strain 168, т.к. он является референсным для всего B.subtilis.
4) Перестановки g-блоков:
В пангеноме обнаружена перестановка блока g5x224, в котором сожержится ген BSU_17490. В трех близких штаммах он занимает одинаковую позицию, а в штаммах CW14 и MB9_B1 смещен и инвертирован:
5) Ошибки аннотации генов:
В ходе анализа аннотации s-блоков полученного пангенома был выявлен пример неверной аннотации одного из геномов. У штамма BS34A наблюдается расширенная рамка кодирующей последовательности по сравнению с другими штаммами, несмотря на идентичную псоследовательность самого гена натрий-фосфатного переносчика. Из чего можно сделать вывод о неверной аннотации у данного штамма.