Выравнивание геномов


Построение нуклеотидного пангенома


Для выполнения заданий данного практикума мною были выбраны 3 штамма бактерии Streptococcus agalactiae: CUGBS591, GBS6, B105.

Streptococcus agalactiae грамположительные факультативные анаэробы, не образующими спор. Это важный патоген, колонизирующий урогенитальный и нижний отдел желудочно-кишечного тракта. Считается, что около 40 % здоровых женщин репродуктивного возраста инфицированы Streptococcus agalactiae. Streptococcus agalactiae является основной причиной сепсиса и менингита новорождённых. Кроме того, В-гемолитический стрептококк группы В может инфицировать пожилых людей и взрослых с иммунодефицитными состояниями


Для работы с NPG-explorer был создан специальный файл, содержащий всю нужную информацию о штаммах для запуска программы: база данных, AC, хромосома, тип ДНК и полное название штамма. Далее выполнялись следующие команды:

npge -g npge.conf npge Prepare &> log_prepare

npge Examine &> log_examine

npge MakePangenome &> log_make

npge PostProcessing &> log_post

Параметры MakePangenome не изменялись. После выполнения получились следующие результаты: log_prepare, log_examine, log_make, log_post.


Описание стабильного ядра нуклеотидного пангенома

Из данного файла были получены следующие данные:

Таблица 1. Стабильное ядро.

Число блоков (s-blocks) Размер нуклеотидного ядра как процент нуклеотидов в ядре от числа нуклеотидов во всех геномах Процент консервативных колонок в объединённом выравнивании s-блоков
188 78.33%99,04%

Для получения информации о h-блоках, то есть о блоках, содержащих фрагмент, находящийся только в части изучаемых геномов, pangenome.bi был преобразован в pangenome.tsv, чтобы можно было анализировать файл с помощью программы Numbers(аналог excel на mac). Далее таблица была отсортирована по столбцу cols в порядке убывания, чтобы найти самые длинные последовательности блоков, а затем был использован фильтр на столбец с названием блока, чтобы отображались лишь блоки, начинающиеся с h. Затем была выбрана самая большая делеция в каждом штамме:

Таблица 2. Самые большие делеции.

Геном Имя блока, подтверждающего делецию Длина блока Имена делятированных генов
GBS6 h2x4559345593 transposase, transcriptional regulator, ATPase, DNA primase
CUGBS591 h2x1060210602keto-deoxy-phosphogluconate aldolase, 2-keto-3-deoxygluconate kinase, gluconate 5-dehydrogenase, PTS mannose transporter subunit IIA, glucuronyl hydrolase, PTS N-acetylgalactosamine transporter subunit
B105 h2x1003510035site-specific integrase, Replication protein RepB, cell division protein FtsK, type II restriction endonuclease

Описание перестановки синтений

С помощью команды qnpge NGS-explorer была выявлены перестановки синтений. Была выявлена одна перестановка g-блока: блока g3x17791 у штамма CUGBS591.

Рис.1 . Перестановка блока g3x17791.

Рис.2 . Перестановка блока g3x17791.