Поиск по сходству (blast)
Untitled Document.md

Сравнение геномов

  1. Построение карты сходства хромосом двух родственных бактерий

C помощью bl2seq были сравнены геномы двух различных организмов, принадлежащих роду Brucella:

Brucella suis ATCC 23445 и Brucella abortus 2308.

картинка Brucella

карта локального сходства 1

карта локального сходства 1

Сравнение 1-ых хромосом.(NC_010169.1 и NC_007618.1)

Вверху обнаружена небольшая вставка.

карта локального сходства 2

карта локального сходства 2

Сравнение 2-х хромосом.(NC_010167.1 и NC_007624.1)

Обнаружена инверсия,а также вставка вверху.

  1. Построение нуклеотидного пангенома с помощью NPGE

С помощью пакета NPG-explorer был построен нуклеотидный пангеном для

четырех штаммов Helicobacter pylori.

Создан файл genomes.tsv в необходимом формате.

Далее были выполнены следующие команды:

npge -g npge.conf

npge Prepare

npge Examine

npge MakePangenome

npge PostProcessing

qnpge # выполнена в Windows после установки NPG explorer

Работа с qnpge :

Были использованы параметры - MIN_IDENTITY = 0.899, WORKERS = 1 для kodomo.

Изучение началось с g блоков.

Информация о g - блоках (взята из blocks.gbi и pangenome.info):
Общее количество блоков 73(это число включает и i блоки), 
общая длина блоков 1601867 (81.08%), процент совпадений 0.935798.

Рис. 1 Фрагмент выравнивания Интерес представляют блоки, которые встречаются только в одном штамме из четырех.

Рис. 2 Консервативные участки Информация об s - блоках: Количество блоков - 468, суммарная длина 1312631 (66.44%), процент консервативности 0.935067. Информация об r - блоках(из pangenome.bi): Всего r-блоков 202, процент совпадения 0.944702, блоки длины от 2х до 10,суммарная длина блоков составляет 42592 (2.15%). Самый часто встречающийся r-блок - r10*116.

Рис 3 r - блок r10*116

Длина - 116, количество фрагментов 10, процент совпадения 97.4 %. Для него был запущен blastn, вот результат:

Все находки принадлежали к Helicobacter pylori. Описание делеций на h - блоках: Было выбрано несколько блоков: h2*185 - остутствует у India и Hp штаммов.

Рис 3 Фрагмент выравнивания h2*184. h2*184 - присутствует только у India и Hp штаммов.

Рис 4 Фрагмент выравнивания для h2*184. Было найдено большое количество уникальных последовательностей (u - unique), среди них самая длинная 15314, самая короткая 100.

Рис 5 Самые длинные из u блоков. Для самого длинного и самого короткого блока последовательность была проаннотирована в blast.

Рис 6 Выдача blast для самого длинного блока.

Рис 7 Выдача blast для самого короткого блок. В обоих случаях все находки принадлежали к Helicobacter pylori. Скорее всего это можно обьяснить тем, что к этому таксону принадлежит очень большое количество штаммов. Расхождение аннотаций генов одного блока. Найден блок h3*117n1 - ген ( Shi 470 ) в нем представлен как некодирующий (на иллюстрации ниже) - однако в другом месте он же указан как кодирующий.

Рис 8 Расхождение аннотаций генов одного блока.