Учебный сайт Корляковой Марии

Выравнивание геномов

В качестве исследуемого вида была выбрана бактерия Acinetobacter baumannii, в частности, штаммы ZS3, AB048, 5457.

Программа NPG-explorer принимает на вход файл-таблицу genomes.tsv

Затем последовательно были выполнены следующие команды:

npge Prepare &> log_prepare - команда, загружающая и переименовывающая геномные ДНК (файл log_prepare)

npge Examine &> log_examine - команда, оценивающая сходство геномов (файл log_examine)

npge MakePangenome &> log_make - команда, создающая нуклеотидный пангеном (файл log_make)

npge PostProcessing &> log_post - команда, создающая файлы с описанием пангенома (файл log_post)

Информацию о стабильном ядре пангенома можно найти в файле pangenome.info. Всего в пангеноме содержится 449 стабильных блока (или s-blocks). Размер стабильного нуклеотидного ядра относительно числа нуклеотидов во всех блоках составляет 78.65%. Процент консервативных колонок в объединённом выравнивании s-блоков от суммарного числа колонок во всех блоках пангенома составляет 97.39%.

Чтобы получить информацию о блоках (h-блоках), в которых содержится фрагмент, присущий лишь части изучаемых геномов, была использована информация из файла pangenome.bi. Для анализа содержимого файла была использована программа LibreOffice Calc. Далее таблица была отсортирована по столбцу col в порядке убывания, чтобы найти самые длинные последовательности блоков, а затем был использован фильтр на столбец с названием блока, чтобы отображались лишь блоки, начинающиеся с буквы "h". Затем была выбрана самая большая делеция в каждом штамме.

Геном Имя блока, подтверждающего делецию Длина блока Имена некоторых делетированных генов
ZS3 h2x27871 27871 AMP-binding protein; feruloyl-CoA synthase; tannase/feruloyl esterase family alpha/beta hydrolase; tannase/feruloyl esterase family alpha/beta hydrolase; GMC family oxidoreductase; NAD(P)-binding protein
AB048 h2x10138 10138 aldehyde dehydrogenase; rubredoxin-NAD(+) reductase; FAD-binding oxidoreductase; FAD-dependent oxidoreductase; aromatic ring-hydroxylating dioxygenase subunit alpha; hypothetical protein
5457 h2x7583 7583 type I secretion C-terminal target domain-containing protein; MFS transporter; DcaP-like protein; 3-phosphoglycerate dehydrogenase; hydroxyacid dehydrogenase; IclR family transcriptional regulator

Затем с помощью команды qnpge NGS-explorer были выявлены перестановки синтений. Были выявлены две перестановки g-блоков: блока g3x130958 у штамма ZS3 и блока g3x1692 у того же штамма.