Для построения пангенома была выбрана архея Methanococcus maripaludis, штаммы DSM, KA1, C5 и C7.
Входной файл: genomes.tsv
В npge.conf было выбрано значение параметра LOG_TO = ':stdout', после чего для каждой команды stdout перенаправлялся в соответствующий log файл: Prepare.log, Examine.log (пуст), MakePangenome.log, PostProcessing.log (пуст). На stderr при этом выводились только сообщения о начале и окончании работы программы, без каких-либо ошибок.
При запуске MakePangenome значение MIN_IDENTITY было выставлено 0.823, в соответствии с рекомендацией Examine.
S-блоков: 1272, размер нуклеотидного ядра как процент нуклеотидов в ядре от числа нуклеотидов во всех геномах: 56.6%, процент консервативных колонок в объединённом выравнивании s-блоков: 0.86238.
Геномы с делецией | С5, С7 |
Блок | h2x6369 |
Длина | 6369 |
Белки:
гем-связывающие |
860 CDS MMJJ_08660 High-affinity heme uptake system protein IsdE (DSM), 1062 bp >
2094 CDS MMKA1_02010 putative iron compound ABC transporter (KA1), 1062 bp > |
Белки: с участием молибдена | 855 CDS MMJJ_08620 FmdE, Molybdenum formylmethanofuran dehydrogenase (DSM), 585 bp >
2132 CDS MMKA1_02060 molybdenum containing formylmethanofuran (KA1), 594 bp > 857 CDS MMJJ_08610 Molybdopterin molybdenumtransferase (DSM), 1128 bp > 2126 CDS MMKA1_02070 molybdopterin biosynthesis protein (KA1), 1128 bp > |
Oтметим, что на построенном древе штаммы C5 и C7 ближе друг к другу, чем к остальным, так что можно предположить, что делеция произошла ещё у их общего предка.
На изображении выше можно видеть, например, две перестановки блоков у C7: g4x1787 (синий) с инверсией, g4x700 (розовый) с сохранением направления, а также общую для C5 и C7 перестановку g4x126 (светло-фиолетовый) с инверсией.
В блоке s4x3101 выровнены следующие гены:
Fasta-файл с последовательностями этих генов доступен по ссылке.
Старт- и стоп-кодоны у них совпадают, визуально сходство высокое. Так что, скорее всего, аннотацию у DSM этого белка как РНКазы, а не РНК-полимеразы, следует считать ошибкой.
При помощи программы NPG-explorer можно сравнивать геномы (в первую очередь близких организмов, у которых ещё не успело произойти слишком много изменений). В рамках задания были проанализированы геномы четырёх штаммов Methanococcus maripaludis. Они не так уж близки -- стабильное ядро составляет лишь около половины пангенома. Из различий между геномами этих штаммов были описаны примеры делеции и перестановки синтезий. Каждая конкретная перестройка чаще затрагивает лишь один из штаммов или пару более близких друг другу С5 и С7.
Помимо исследования изменений, произошедших с геномами после разделения штаммов, построение пангенома может помочь уточнить и исправить существующую аннотацию генов в конкретном интересующем нас геноме.