Третий семестр
Главный сайт
|
Задание 1
Brucella pinnipedialis
Для рассмотрения я взял scaffold-262 длиной 48647 п.н. Затем он был прогнан через
blastx.
Исходя из находок был выбраан зигомицет (первые три находки - зигомицеты, среди них 2 Rhizopus) Phizopus oryzae
(похоже, в таблице опечатка).
Файлы, полученные от AUGUSTUS:
augustus.aa - гипотетические белки
augustus.cdsexons - нуклеотидные последовательности экзонов
augustus.codingseq - последовательности предсказанных генов
augustus.gbrowse - всевозможные данные информация (начало и конец генов, стопкодоны, интроны, экзоны и др.) в формате GenBank
augustus.gff - полное описание генов (по сути каждому гену все его строки из .gbrowse приписаны)
augustus.gtf - .gbrowse, отсортированные по генам
Экзонная структура
ген экзонов
g1 2
g2 2
g3 1
g4 2
g5 1
g6 1
g7 4
g8 3
g9 2
g10 1
g11 4
g12 3
g13 4
g14 3
g15 1
g16 9
g17 4
g18 1
Для первых 5 генов была проведена проверка функции при помощи blast.
g1 не дал значимых находок (1 находка гипотетического белка). Я не нашел других подтверждений тому, что это ошибочная аннтотация,
но наверное это так.
g2 имеет в своем составе домен хитин-синтазы 1 и, соответственно, много неплохих находок.
g3 имеет домен митохондриального белка-переносчика и тоже много хороших находок.
g4 не имеет консервативных доменов, но находки указывают на то, что это репликативный белок митохондрий.
g5 представляет собой домен пептидазы C19. Находки подтверждают это.
Задание 2
Для сравнения аннотаций был выбран ген гемоглобина-B (HBB).
Ген длиной 2,718 п.н. расположен на 11-ой хромосоме на позициях 5224959-5227676 (обратная цепь).
Таблица экзонов
Видно, что тут Augustus оплошал. Он считает экзоны гемоглобина B частью огромного белка с 17 экзонами.
Надо полагать, что гемоглобин B, с которым связана например серповидно-клеточная анемия хорошо изучен,
и данные о нем из RefSeq можно считать верными. Кроме того из таблицы видно, что хотя экзоны и их кодирующие
участки могут иметь любые рамки, общая длина кодирующей последоательности кратна трем. Кроме того видно,
что у мРНК есть 5' и 3' нетранслируемые участки.
|