Выравнивание геномов

Задание 1


Для выполнения данного задания я выбрала следующие организмы: бактерии Rickettsia rickettsii и Rickettsia prowazekii
Ссылки на геномы:
  • Rickettsia rickettsii

  • Rickettsia prowazekii


  • При помощи blast2seq была получена карта локального сходства, представленная на рисунке 1


    Рисунок 1 Карта сходства хромосом. Координаты генома Rickettsia rickettsii откладываются по оси X, Rickettsia prowazekii - по оси Y.

    Голубой рамочкой обведён участок с координатами 630-760K (по хромосоме Rickettsia rickettsii).
    На мой взгляд, здесь произошла транслокация: поменялись местами первый и второй фрагменты хромосомы с третьим фрагментом

    Так же при помощи blast2seq я строила выравнивание данных геномов. Они, как оказалось, имеют приемлемое сходство - 92%

    Задание 2


    При выполнении задания я использовала NGP-explorer (чтобы построить нуклеотидный пангеном)
    В качестве материала я использовала 4 штамма бактерии Rickettsia rickettsii. Файл с информацией о последовательности геномных ДНК


    Рисунок 2 Использованные команды

    Далее используем следующие файлы

  • blocks.gbi - содержит информацию о блоках

  • blocks.blocks - дает информацию о порядке локализации g-блоков в хромосоме

  • pangenome.info - содержит информацию о стабильных блоках


  • Описание g-блоков и их перестановок


    После анализа файла blocks.gbi было выяснено, что в хромосоме каждого штамма содержится только один глобальный блок g4x1269809
    Он состоит из 4 фрагментов и содержит в выравнивании 1269809 позиций
    В хромосоме каждого из штаммов он расположен на прямой цепи

    Описание s-блоков


    Число стабильных блоков - 108
    Каждый s-блок состоит из 4 фрагментов
    Суммарная длина 1240151 (98.39%)
    Консервативных позиций при выравнивании s-блоков 0.999

    Описание r-блоков


    pangenome.gi - используем для описания блоков с повторами
    Наиболее встречающиеся блоки:
  • r16x225. Имеет 16 повторов, длина: 225.

  • В хромосоме штамма Arizona присутствует 1 раз, Iowa - 3, в штаммах Morgan и R - по 6
  • r22x159. Имеет 22 повтора в рассматриваемых геномах, длина: 159.

  • 2 раза встречается в хромосоме штамма Arizona, 6 раз в штамме Iowa, по 7 раз в штаммах Morgan и R

    Описание h- блоков


    У штаммов Iowa и Morgan присутствуют 7 полустабильных блоков
    У Iowa - 6, у R - всего один (h3x115)
    Рассмотрим участок h3x115. Данный участок длиной 115 содержится во всех штаммах, кроме Arizona. Следовательно, можно предположить, что у данного штамма произошла делеция данного участка хромосомы.
    Это подтверждает визуализатор qnpge

    Рисунок 3
    На данном участке располагается фрагмент одного генa в штамме Iowa. Он кодирует гипотетический белок.

    Описание u-блоков


    Уникальных последовательностей, у которых нет гомологов среди всех генов, кроме себя, найдено не было.
    Это можно объяснить тем, что все четыре генома имеют очень значительное сходство и просто не имеют таких u-блоков.

    Примеры расхождений между аннотациями генов из одного блока.


    Приведу в качестве примера блок блока h3x806
    В нём в штамме Arizona аннотирован ген 3-гидроксиацил-КоА дегидрогиназы, ген гипотетического белка аннотирован в штамме Iowa, а в штамме Morgan данный участок не признаётся за ген.

    Рисунок 3

    Ссылки
  • The National Center for Biotechnology Information
  • © Козлова Анастасия, 2015