Семестры
Сайт ФББ МГУ
Kodomo Wiki
NCBI
|
RanHummer personal web-site
Предсказание генов эукариот
Задание 1. Предсказание генов X5 с помощью AUGUSTUS
Для выполнения задания был выбран скэффолд scaffold-266 длиной 47841 п.н.
Поиск родственных организмов осуществлялся с помощью blastx.
Рис.1. Орагнизмы для которых найдена наибольшая гомология с исходной последовательностью.
Для дальнейшей работы с AUGUSTUS был выбран Rhizopus oryzae, как наиболее родственный организм, найденным blast'ом
Страница с описанием статуса задания.
Описание полученных файлов:
- augustus.aa - аминокислотные последовательности для предсказанных генов
- augustus.cdsexons - нуклеотидные последовательности экзонов
- augustus.codingseq - кодирующие нуклеотидные последовательности для предсказанных генов
- augustus.gbrowse - вся информация (координаты CDS, интронов, старт- и стоп- кодонов, цепь, координаты инициаторной и терминальной последовательности гена) в формате GenBank
- augustus.gff - полное описание генов
- augustus.gtf - содержит практически ту же информацию, что и файл augustus.gff, только без последовательностей и в виде единой таблицы
Проверка предсказаний с помощью blast
Были выбраны 5 генов: g4, g5, g7, g10, g12
Для проверки проводился blastp
- g4
не дал значимых находок (2 находки с E-value=10), Скорее всего это ошибочная аннотация.
- g5
не дал находок.
- g7
дал только 1 находку с e-value 2.1, её тоже нельзя назвать гомологом
- g10:
Лучшие находки, и скорее всего гомологи g10, являются генами сериновой гидролазы.
- g12
не дал находок.
Задание 2. Сравнение аннотаций Refseq и AUGUSTUS гена CASP3 человека
Белок CASP3 является членом семейства цистеин-аспарагиновой протеазы кислоты (каспазы). Это семейство имеет важную росль в регуляции клеточного апоптоза (программируемой клеточной гибели). С данными сравнения аннотаций можно ознакомиться по ссылке.
Рис.3. Аннотации генов, полученные при помощи UCSC Genome Browser. Толстые линии - экзоны, тонкие - интроны
- Координаты гена: 4-ая хромосома, 184627696-184649475 (длина - 21779 п.н.), -ориентация.
- Таблица сравнения аннотаций Refseq и AUGUSTUS
- Аннотация из RefSec имеет на один экзон больше (RefSeq - 8, AUGUSTUS - 7). AUGUSTUS сократил последний экзон с 1807 до 1085 из RefSeq), т.к. он не добавляет Poly-A хвост, и не нашел второй экзон, но нашел первый, впрочем, удлинив его почти в три раза (231 против 82 из RefSeq). Границы интронов предсказаны верно, кроме, очевидно, первых двух (слиты воедино и чуть удлинены).
|