Построение нуклеотидного пангенома с помощью NPG-explorer
Для составления пангеном я взял три штама бактерии Wolbachia pipientis:
Исходник располагается здесь, лог файлы для Prepare и MakePangenome.
Описание стабильного ядра нуклеотидного пангенома
Информация о пангеноме доступна по этой ссылке.
Всего имеется 262 стабильных (S)-блоков, средняя идентичность среди S-блоков составила 99.39%. Процент нуклеотидов в ядре от общего числа - 97.82%.
Я решил проанализировать h-блоки длиной более 500 п.н., чтобы посмотреть какие интересные делеции могут встретиться. Таких h-блока всего 4, информация взята из файлаpangenome.bi.
Я решил поискать транспозоны в пангеноме и наткнулся на IS4 family transposase, которая имелась у всех 3-х штаммов (была обнаружена в S-блоке). Это достаточно распространенное семейство транспозонов, которые встречаются как у бактерий, так и архей.
Более того, в r-блоке было найдено несколько повторов, содержащих ген, кодирующий транспозазу семейства IS481. То есть произошли многократный циклы дупликации транспозона.
Затем я решил посмотреть u-блоки, то есть содержащие уникальную последовательность. И какова была моя радость, когда я обнаружил в блоке u1x148 хвостик бактериофага (phage tail protein по-научному) у wAlbB-FL2016. Таким образом, у этого штамма произошла трансдукция - перенос вирусом ДНК с последующим интегрированием в геном.
Анализируя S-блоки, я наткнулся на смещение рамки гипотетического белка в одном из штаммов, несмотря на идентичную последовательность. По сути это говорит об ошибки аннотации.