Выравнивание геномов
В качестве исследуемого вида была выбрана бактерия Acinetobacter baumannii, в частности, штаммы ZS3, AB048, 5457.
Программа NPG-explorer принимает на вход файл-таблицу genomes.tsv
Затем последовательно были выполнены следующие команды:
npge Prepare &> log_prepare - команда, загружающая и переименовывающая геномные ДНК (файл log_prepare)
npge Examine &> log_examine - команда, оценивающая сходство геномов (файл log_examine)
npge MakePangenome &> log_make - команда, создающая нуклеотидный пангеном (файл log_make)
npge PostProcessing &> log_post - команда, создающая файлы с описанием пангенома (файл log_post)
Информацию о стабильном ядре пангенома можно найти в файле pangenome.info. Всего в пангеноме содержится 449 стабильных блока (или s-blocks). Размер стабильного нуклеотидного ядра относительно числа нуклеотидов во всех блоках составляет 78.65%. Процент консервативных колонок в объединённом выравнивании s-блоков от суммарного числа колонок во всех блоках пангенома составляет 97.39%.
Чтобы получить информацию о блоках (h-блоках), в которых содержится фрагмент, присущий лишь части изучаемых геномов, была использована информация из файла pangenome.bi. Для анализа содержимого файла была использована программа LibreOffice Calc. Далее таблица была отсортирована по столбцу col в порядке убывания, чтобы найти самые длинные последовательности блоков, а затем был использован фильтр на столбец с названием блока, чтобы отображались лишь блоки, начинающиеся с буквы "h". Затем была выбрана самая большая делеция в каждом штамме.
Геном | Имя блока, подтверждающего делецию | Длина блока | Имена некоторых делетированных генов |
ZS3 | h2x27871 | 27871 | AMP-binding protein; feruloyl-CoA synthase; tannase/feruloyl esterase family alpha/beta hydrolase; tannase/feruloyl esterase family alpha/beta hydrolase; GMC family oxidoreductase; NAD(P)-binding protein |
AB048 | h2x10138 | 10138 | aldehyde dehydrogenase; rubredoxin-NAD(+) reductase; FAD-binding oxidoreductase; FAD-dependent oxidoreductase; aromatic ring-hydroxylating dioxygenase subunit alpha; hypothetical protein |
5457 | h2x7583 | 7583 | type I secretion C-terminal target domain-containing protein; MFS transporter; DcaP-like protein; 3-phosphoglycerate dehydrogenase; hydroxyacid dehydrogenase; IclR family transcriptional regulator |
Затем с помощью команды qnpge NGS-explorer были выявлены перестановки синтений. Были выявлены две перестановки g-блоков: блока g3x130958 у штамма ZS3 и блока g3x1692 у того же штамма.