Для выполнения заданий данного практикума мною были выбраны 3 штамма бактерии Streptococcus agalactiae: CUGBS591, GBS6, B105.
Streptococcus agalactiae грамположительные факультативные анаэробы, не образующими спор. Это важный патоген, колонизирующий урогенитальный и нижний отдел желудочно-кишечного тракта. Считается, что около 40 % здоровых женщин репродуктивного возраста инфицированы Streptococcus agalactiae. Streptococcus agalactiae является основной причиной сепсиса и менингита новорождённых. Кроме того, В-гемолитический стрептококк группы В может инфицировать пожилых людей и взрослых с иммунодефицитными состояниями
Для работы с NPG-explorer был создан специальный файл, содержащий всю нужную информацию о штаммах для запуска программы: база данных, AC, хромосома, тип ДНК и полное название штамма. Далее выполнялись следующие команды:
npge -g npge.conf npge Prepare &> log_prepare
npge Examine &> log_examine
npge MakePangenome &> log_make
npge PostProcessing &> log_post
Параметры MakePangenome не изменялись. После выполнения получились следующие результаты: log_prepare, log_examine, log_make, log_post.
Из данного файла были получены следующие данные:
Таблица 1. Стабильное ядро.
Число блоков (s-blocks) | Размер нуклеотидного ядра как процент нуклеотидов в ядре от числа нуклеотидов во всех геномах | Процент консервативных колонок в объединённом выравнивании s-блоков |
---|---|---|
188 | 78.33% | 99,04% |
Для получения информации о h-блоках, то есть о блоках, содержащих фрагмент, находящийся только в части изучаемых геномов, pangenome.bi был преобразован в pangenome.tsv, чтобы можно было анализировать файл с помощью программы Numbers(аналог excel на mac). Далее таблица была отсортирована по столбцу cols в порядке убывания, чтобы найти самые длинные последовательности блоков, а затем был использован фильтр на столбец с названием блока, чтобы отображались лишь блоки, начинающиеся с h. Затем была выбрана самая большая делеция в каждом штамме:
Таблица 2. Самые большие делеции.
Геном | Имя блока, подтверждающего делецию | Длина блока | Имена делятированных генов |
---|---|---|---|
GBS6 | h2x45593 | 45593 | transposase, transcriptional regulator, ATPase, DNA primase |
CUGBS591 | h2x10602 | 10602 | keto-deoxy-phosphogluconate aldolase, 2-keto-3-deoxygluconate kinase, gluconate 5-dehydrogenase, PTS mannose transporter subunit IIA, glucuronyl hydrolase, PTS N-acetylgalactosamine transporter subunit |
B105 | h2x10035 | 10035 | site-specific integrase, Replication protein RepB, cell division protein FtsK, type II restriction endonuclease |
С помощью команды qnpge NGS-explorer была выявлены перестановки синтений. Была выявлена одна перестановка g-блока: блока g3x17791 у штамма CUGBS591.