Для выполнения задания были выбраны следующие штаммы кишечной палочки (Escherichia coli): Escherichia coli strain ST130, Escherichia coli strain AQ15, Escherichia coli strain E118, Escherichia coli strain 8-3-Ti3 и Escherichia coli strain S17-1.
Перед запуском программы был создан файл genomes.tsv
Выходной файл | Команда | Описание |
npge.conf | npge -g npge.conf | Получил файл содержащий параметры для пангенома. "WORKERS" был заменен с 2 на 1, "MIN_IDENTITY" с 0.9 на 0.870 из файла identity_recommended.txt, полученного командой "npge Examine &>log_examine" |
log_prepare | npge Prepare &> log_prepare | Скачивание геномных ДНК |
log_examine | npge Examine &> log_examine | Оценка сходства геномов |
log_make | npge MakePangenome &> log_make | Создание пангенома |
log_post | npge PostProcessing &> log_post | Информация о пангеноме |
Информация из таблицы ниже была взята из файла pangenome.info
Число блоков | 709 |
Размер нуклеотидного ядра как % нуклеотидов от общего числа нуклеотидов в геномах | 73.43% |
процент консервативных колонок в объединённом выравнивании s-блоков | 96.7463% |
Длина фрагментов | от 100 до 32745 |
Исходный файл pangenome.bi был импортирован в excel, отсортирован длине делеции от большего к меньшему
Штамм | Блок | Длина/ | Делетированные гены |
Escherichia coli strain 8-3-Ti3 | h4x7317 | 7317 | 5607 CDS FZ043_04755 EAL domain-containing protein |
Escherichia coli strain ST130 | h4x5092 | 5092 | 11693 CDS HFC66_09830 NADPH-dependent aldehyde reductase Ahr |
Escherichia coli strain AQ15 | h4x6018 | 6018 | 11147 CDS HFC66_07100 hypothetical protein |
Escherichia coli strain E118 | h4x7975 | 7975 | 12312 CDS HFC66_12925 transcriptional antiterminator BglG |
Escherichia coli strain S17-1 | h4x5109 | 5109 | 11300 CDS HFC66_07865 type VI secretion system ATPase TssH |
Для поиска синтений я использовал файл blocks.blocks Я выбрал перестановку блока g5x3894. У штамма 8-3-Ti3 он оказался смещен на 1 блок назад в то время как у остальных штаммов его расположение совпадает.