Построение нуклеотидного пангенома с помощью NPG-explorer

Для составления пангеном я взял три штама бактерии Wolbachia pipientis:

Исходник располагается здесь, лог файлы для Prepare и MakePangenome.

Описание стабильного ядра нуклеотидного пангенома

Информация о пангеноме доступна по этой ссылке.

Всего имеется 262 стабильных (S)-блоков, средняя идентичность среди S-блоков составила 99.39%. Процент нуклеотидов в ядре от общего числа - 97.82%.

Описание делеций

Я решил проанализировать h-блоки длиной более 500 п.н., чтобы посмотреть какие интересные делеции могут встретиться. Таких h-блока всего 4, информация взята из файлаpangenome.bi.

Трансдукция, транспозоны

Я решил поискать транспозоны в пангеноме и наткнулся на IS4 family transposase, которая имелась у всех 3-х штаммов (была обнаружена в S-блоке). Это достаточно распространенное семейство транспозонов, которые встречаются как у бактерий, так и архей.

Рис.1 Транспозаза семейства IS4

Более того, в r-блоке было найдено несколько повторов, содержащих ген, кодирующий транспозазу семейства IS481. То есть произошли многократный циклы дупликации транспозона.

Рис.2 Транспозаза семейства IS481 в r-блоке

Затем я решил посмотреть u-блоки, то есть содержащие уникальную последовательность. И какова была моя радость, когда я обнаружил в блоке u1x148 хвостик бактериофага (phage tail protein по-научному) у wAlbB-FL2016. Таким образом, у этого штамма произошла трансдукция - перенос вирусом ДНК с последующим интегрированием в геном.

Рис.3 Хвостик бактериофага

Ошибка аннотации

Анализируя S-блоки, я наткнулся на смещение рамки гипотетического белка в одном из штаммов, несмотря на идентичную последовательность. По сути это говорит об ошибки аннотации.

Рис.4 Ошибка аннотации
© Руслан Нагимов, 2021