Практикум 6


Задание 1

Из сборки генома X5 был выбран скэффолд (scaffold-698), длина которого составляет 23460 п.о.
При помощи blastx был произведен поиск близкородственного организма, так как этот алгоритм ищет продект гена.
Самым близким организмом, для которого было произведено обучение сервиса AUGUSTUS - Ustilago maydis (fungus)
Результат работы AUGUSTUS включает следующие файлы:
Augustus.aa содержит аминокислотные последовательности белков, транслированные с найденных генов (формат fasta).
Augustus.cdsexons содержит нуклеотидные последовательности экзонов найденных в предсказанных генах (формат fasta).
Augustus.codingseq содержит кодирующие нуклеотидные последовательности генов.
Augustus.gbrowse представляет информацию, обрабатываемую геномным браузером GBrowse;
Augustus.gff содержит подробную информацию о предсказанных генах. Указаны координаты: интронов, CDS, гена, его транскрипта, старт- и стоп-кодонов.
Augustus.gtf содержит ту же информацию, что и файл augustus.gff в виде единой таблицы.
Далее был произведен анализ для 2 предсказанных генов:g1 и g2.
Для первого были обнаружены три находки:
Для первого были обнаружены три хорошие находки:
Первая (подтверждена на гомологичном уровне)
Вторая (экспериментально)
Третья (экспериментально)
Для второго были обнаружены две подтвержденные находки:
Первая (подтверждена на гомологичном уровне)
Вторая (экспериментально)
У всех гомологов очень низкий Score, так что существует вероятность ошибки

Задание 2

Для этого задания был выбран ген человека IRF6.
IRF6 (interferon regulatory factor 6) - регулирующий интерферон фактор 6 — белок, который у человека, кодируется геном IRF6.
Регуляторные факторы интерферона содержат консервативную N-концевую область около 120 аминокислот, содержащиеся в структуре, которая специфически связывается с последовательностью интерферонного консенсуса (ICS), стоящего перед генами интерферона.
Остальные части последовательности регуляторного фактора интерферона изменяются в зависимости от точной функции белка.
По данным NCBI данный ген располагается на 1 хромосоме. Координаты: 209785623..209806175
Скриншот с браузера
Таблица сравнения
Что хотелось бы отметить при сравнении аннотаций:
В предсказаниях не совпадают координаты начала 1 экзона и координаты конца последнего (отличия выделены в таблице красным цветом).
1 экзон в аннотации Refseq разбит на три экзона в аннотации AUGUSTUS (выделены светло-зеленым)
В аннотации Refseq указан 8 экзон, который не определил AUGUSTUS (выделен зеленым). Можно предположить, что AUGUSTUS не аннотировал этот экзон так как он, вероятно, вырезается или нет при альтернативном сплайсинге.
В аннотации Refseq CDC не делится на 3 без остатка, так же, как и CDC для AUGUSTUS, что нетипично.
Конец CDC у Refseq и AUGUSTUS совпадают, в отличии от начала.
В целом аннотации сильно отличаются

Третий семестр

Главная страница


© Полина Николаева 2014.
http://bioinf.uni-greifswald.de/webaugustus/prediction/show/0db58f8a512533480151e4534e86019b organism Ustilago maydis 521] Из сборки генома X5 был выбран один скэффолд (scaffold-698), длина которого составляет 23460 п.о.