Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI

RanHummer personal web-site


Предсказание генов эукариот

Задание 1. Предсказание генов X5 с помощью AUGUSTUS

Для выполнения задания был выбран скэффолд scaffold-266 длиной 47841 п.н.
Поиск родственных организмов осуществлялся с помощью blastx.

Рис.1. Орагнизмы для которых найдена наибольшая гомология с исходной последовательностью.


Для дальнейшей работы с AUGUSTUS был выбран Rhizopus oryzae, как наиболее родственный организм, найденным blast'ом


Страница с описанием статуса задания.

Описание полученных файлов:

  • augustus.aa - аминокислотные последовательности для предсказанных генов
  • augustus.cdsexons - нуклеотидные последовательности экзонов
  • augustus.codingseq - кодирующие нуклеотидные последовательности для предсказанных генов
  • augustus.gbrowse - вся информация (координаты CDS, интронов, старт- и стоп- кодонов, цепь, координаты инициаторной и терминальной последовательности гена) в формате GenBank
  • augustus.gff - полное описание генов
  • augustus.gtf - содержит практически ту же информацию, что и файл augustus.gff, только без последовательностей и в виде единой таблицы

Проверка предсказаний с помощью blast

Были выбраны 5 генов: g4, g5, g7, g10, g12
Для проверки проводился blastp


  • g4 не дал значимых находок (2 находки с E-value=10), Скорее всего это ошибочная аннотация.
  • g5 не дал находок.
  • g7 дал только 1 находку с e-value 2.1, её тоже нельзя назвать гомологом
  • g10: Лучшие находки, и скорее всего гомологи g10, являются генами сериновой гидролазы.
  • g12 не дал находок.

Задание 2. Сравнение аннотаций Refseq и AUGUSTUS гена CASP3 человека

Белок CASP3 является членом семейства цистеин-аспарагиновой протеазы кислоты (каспазы). Это семейство имеет важную росль в регуляции клеточного апоптоза (программируемой клеточной гибели). С данными сравнения аннотаций можно ознакомиться по ссылке.

Рис.3. Аннотации генов, полученные при помощи UCSC Genome Browser. Толстые линии - экзоны, тонкие - интроны

  • Координаты гена: 4-ая хромосома, 184627696-184649475 (длина - 21779 п.н.), -ориентация.
  • Таблица сравнения аннотаций Refseq и AUGUSTUS
  • Аннотация из RefSec имеет на один экзон больше (RefSeq - 8, AUGUSTUS - 7). AUGUSTUS сократил последний экзон с 1807 до 1085 из RefSeq), т.к. он не добавляет Poly-A хвост, и не нашел второй экзон, но нашел первый, впрочем, удлинив его почти в три раза (231 против 82 из RefSeq). Границы интронов предсказаны верно, кроме, очевидно, первых двух (слиты воедино и чуть удлинены).

© Поляков Игорь aka RanHummer