Учебный сайт Лидии Гаркуль

Выравнивание геномов. NPG-explorer.

В данном практикуме с помощью прогpaммы NPG-explorer был построен и исследован нуклеотидный пангеном вида Listeria monocytogenes. Строился пангеном на основе четырех штамов выбранного вида: Listeria monocytogenes strain FDA00011238, Listeria monocytogenes EGD-e, Listeria monocytogenes strain NCTC10357, Listeria monocytogenes strain N1-011A

Построение нуклеотидного пангенома с помощью NPG-explorer

Был создан файл genomes.tsv, описывающий входные данные. Далее в командную строку Windows были введены следующие команды:

Описание стабильного ядра нуклеотидного пангенома

Из файла pangenome.info была получена следующая информация:

Описание крупной делеции в каждом геноме

Для поиска делеций в геноме в Excel был открыт файл pangenome.bi. Столбцы, начинающиеся на h, были отфильтрованы по длине (итоговый файл лежит тут). Информация о самых длинных делециях в четырех геномах представлена в таблице 1. Для поиска имен делятированных генов была использована визуализация qnpge.

Таблица. 1. Информация о делециях.
Название генома Имя блока Длина делеции Имена делятированных генов
FDA00011238 h2x54902 54902 rRNA B1S31_01165 5S ribosomal RNA (FDA00011238); rRNA SAMEA44515918_00232 5S ribosomal RNA (NCTC10357)
N1 h2x54902 54902 rRNA B1S31_01165 5S ribosomal RNA (FDA00011238); rRNA SAMEA44515918_00232 5S ribosomal RNA (NCTC10357)
NCTC10357 h2x7226 7226 CDS SAMEA44515918_02697 CRISPR type II-A/NMEMI-associated protein Csn2 (NCTC10357)
EGD h2x6489 6489 CDS SAMEA44515918_00766 Ribose operon repressor (NCTC10357),

Описание перестановок синтений (g-блоков) в одном геноме

Для изучения перестановок g-блоков был использован файл blocks.blocks (итоговый Excel-файл можно найти тут). Соответствующие перестановки g-блоков были раскрашены в одинаковые цвета (см. рис.1.)

align
Рис. 1. Перестановки g-блоков.

Из рисуунка видно, что геномы FDA00011238 и NCTC10357 очень схожи - g-блоки находятся на одном месте. Другие же два генома отличаются и относительно друг друга и относительно первых двух.

Выводы

Программа NPG-explorer позволят достаточно легко строить и удобно визуализировать пангеномы близкородстенных организмов.

С помощью данной программы в практикуме на основе четырех штаммов вида Listeria monocytogenes был построен пангеном. Из аналитических файлов была получена инфомация о размерах нуклеотидного ядра. В него вошло 97.42% нуклеотидов относительно числа нуклеотидов во всех геномах. Были полученны данные о крупных делециях во всех четырех пангеномах - длина и имена некоторых делятированных генов. Также для данных штамов (так как они очень близкородстенные) хорошо видны перестановки синтений.