Предсказание генов эукариот

Предсказание генов с помощью AUGUSTUS

Из сборки генома X5 я выбрал scaffold-266, длина - 47841 п.о.

blastx показал, что из списка организмов AUGUSTUS наибольшее сходство имеет Candida tropicalis.
Этот организм я и использовал для работы.

    Файлы, которые выдал AUGUSTUS
  1. augustus.aa - аминокислотные последовательности для предсказанных генов (транслированные)
  2. augustus.cdsexons - нуклеотидные последовательности экзонов(стоп-кодон не указывается)
  3. augustus.codingseq - кодирующие нуклеотидные последоавтельности для предсказанных генов
  4. augustus.gbrowse - вся информация (начало, конец генов, интроны, экзоны и др.) в формате GenBank
  5. augustus.gff - то же только в формате таблицы с разделением на гены и приведенной для каждого гена CDS
  6. augustus.gtf - то же только в формате обычной таблицы

Проверка предсказания с помощью blastp

Сравнение аннотаций Refseq и AUGUSTUS гена DDIAS (Homo sapiens DNA damage-induced apoptosis suppressor)

Сравнение аннотаций в таблице (экзон - интронная структура)

Ген DDIAS расположен на 11 хромосоме, его координаты chr11:82901695-82934657, ориентация +

Как видно из таблицы и визуализации Genome Browser, AUGUSTUS выдал две очень похожие аннотации - в обеих нашел "лишний" второй экзон, не нашел 2 экзона в середине, немного ошибся с началом гена (укоротил) и с его концом (удлинил).


Моя главная страница
© Sergey Starikov, 2015