На главную

EMBOSS и сравнение геномов

Применение EMBOSS

  1. Задача: несколько файлов в формате fasta собрать в единый файл
    Вход: file1.fasta, file2.fasta, file3.fasta, listfile.txt
    Команда: seqret @listfile.txt task1.fasta
    Выход: task1.fasta
  2. Задача: несколько файлов в формате fasta собрать в единый файл
    Вход: task1.fasta
    Команда: seqretsplit task1.fasta -auto
    Выход: amo_kleok.fasta, mtnd_kleox.fasta, ddrfa_kleok.fasta
  3. Задача: из файла с хромосомой в формате .gb вырезать три кодирующих последовательности по указанным координатам "от", "до", "ориентация" и сохранить в одном fasta файле
    Вход: sequence.gb
    Команда: seqret @listfile1.txt task3.fasta
    Выход: task3.fasta
  4. Задача: транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Результат - в одном fasta файле
    Вход: task3.fasta
    Команда: transeq task3.fasta task4.fasta -table 11 -auto
    Выход: task4.fasta
  5. Задача: транслировать данную нуклеотидную последовательность в шести рамках
    Вход: task3.fasta
    Команда: transeq task3.fasta:CP000837 task5.fasta -table 11 -frame 6 -auto
    Выход: task5.fasta

Сравнение геномов

Построим карту локального сходства геномов двух бактерий семейства Enterobacteriaceae: Klebsiella oxytoca и Citrobacter amalonaticus (RefSeq ID NZ_CP011636.1 и NZ_CP014070.1 соответственно). Внутри выравниваний высокого качества (предположительно, соответствующих гомологичным участкам геномов) совпадают 83% нуклеотидов — достаточно высокий показатель.

Карта локального сходства (по абсциссе — геном Klebsiella oxytoca)

Перецентрируем карту: отперация соответствует другому выбору начальных точек на кольцевых хромосомах.

Исходная карта (отмечено новое начало координат) Новая карта

Получить точные координаты для участков, затронутых эволюционными событиями, не представляется возможным, поскольку построено 7582 выравнивания, при этом общее покрытие лучших из них невысоко (см. диаграмму ниже); участки будут отмечены на карте сходства.

Покрытие 101 локального выравнивания с наибольшим Score

Размеченная карта локального сходства

Здесь видно, что для красного участка произошла инверсия. Опишем одну из возможных последовательностей эволюционных событий для зеленого участка:


© Посицельская Екатерина, 2015