Практикум №12. Предсказание генов эукариот.
1. Предсазание генов X5 с помощью AUGUSTUS.
Для выполнения задания был выбран скэффолд scaffold-266 длиной 47841 п.н.
Поиск родственных организмов осуществлялся с помощью blastx.
Рис.1. Орагнизмы для которых найдена наибольшая гомология с исходной последовательностью.
Для дальнейшей работы с AUGUSTUS был выбран Rhizopus oryzae, как наиболее родственный организм, найденным blast'ом
Страница с описанием статуса задания.
Описание полученных файлов:
- augustus.aa - аминокислотные последовательности для предсказанных генов
- augustus.cdsexons - нуклеотидные последовательности экзонов
- augustus.codingseq - кодирующие нуклеотидные последовательности для предсказанных генов
- augustus.gbrowse - вся информация (координаты CDS, интронов, старт- и стоп- кодонов, цепь, координаты инициаторной и терминальной последовательности гена) в формате GenBank
- augustus.gff - полное описание генов
- augustus.gtf - содержит праткически ту же информацию, что и файл augustus.gff, только без последовательностей и в виде единой таблицы
Проверка предсказаний с помощью blast
Были выбраны 5 генов: g4, g5, g7, g10, g12.
Для проверки проводился blastp
- g4 не дал значимых находок (2 находки с E-value=10), Скорее всего это ошибочная аннотация.
- g5 не дал находок.
- g7 дал только 1 находку с e-value 2.1, её тоже нельзя назвать гомологом
- g10: Лучшие находки, и скорее всего гомологи g10, являются генами сериновой гидролазой.
- g12 не дал находок.
2. Сравнение аннотаций Refseq и AUGUSTUS гена CASP3 человека
Рис.3. Аннотации генов, полученные при помощи UCSC Genome Browser. Толстые линии - экзоны, тонкие - интроны
- Координаты гена: 4-ая хромосома, 184627696-184649475, -ориентация.
- Таблица сравнения аннотаций Refseq и AUGUSTUS
- Аннотация из RefSec имеет на один экзон больше, поэтому и длина соответсвтующих интронов различается в различных аннотациях.