В данном практикуме с помощью прогpaммы NPG-explorer был построен и исследован нуклеотидный пангеном вида Listeria monocytogenes. Строился пангеном на основе четырех штамов выбранного вида: Listeria monocytogenes strain FDA00011238, Listeria monocytogenes EGD-e, Listeria monocytogenes strain NCTC10357, Listeria monocytogenes strain N1-011A
Был создан файл genomes.tsv, описывающий входные данные. Далее в командную строку Windows были введены следующие команды:
Из файла pangenome.info была получена следующая информация:
Для поиска делеций в геноме в Excel был открыт файл pangenome.bi. Столбцы, начинающиеся на h, были отфильтрованы по длине (итоговый файл лежит тут). Информация о самых длинных делециях в четырех геномах представлена в таблице 1. Для поиска имен делятированных генов была использована визуализация qnpge.
Название генома | Имя блока | Длина делеции | Имена делятированных генов |
---|---|---|---|
FDA00011238 | h2x54902 | 54902 | rRNA B1S31_01165 5S ribosomal RNA (FDA00011238); rRNA SAMEA44515918_00232 5S ribosomal RNA (NCTC10357) |
N1 | h2x54902 | 54902 | rRNA B1S31_01165 5S ribosomal RNA (FDA00011238); rRNA SAMEA44515918_00232 5S ribosomal RNA (NCTC10357) |
NCTC10357 | h2x7226 | 7226 | CDS SAMEA44515918_02697 CRISPR type II-A/NMEMI-associated protein Csn2 (NCTC10357) |
EGD | h2x6489 | 6489 | CDS SAMEA44515918_00766 Ribose operon repressor (NCTC10357), |
Для изучения перестановок g-блоков был использован файл blocks.blocks (итоговый Excel-файл можно найти тут). Соответствующие перестановки g-блоков были раскрашены в одинаковые цвета (см. рис.1.)
Из рисуунка видно, что геномы FDA00011238 и NCTC10357 очень схожи - g-блоки находятся на одном месте. Другие же два генома отличаются и относительно друг друга и относительно первых двух.
Программа NPG-explorer позволят достаточно легко строить и удобно визуализировать пангеномы близкородстенных организмов.
С помощью данной программы в практикуме на основе четырех штаммов вида Listeria monocytogenes был построен пангеном. Из аналитических файлов была получена инфомация о размерах нуклеотидного ядра. В него вошло 97.42% нуклеотидов относительно числа нуклеотидов во всех геномах. Были полученны данные о крупных делециях во всех четырех пангеномах - длина и имена некоторых делятированных генов. Также для данных штамов (так как они очень близкородстенные) хорошо видны перестановки синтений.