Предсказание генов эукариот

Третий семестр Главный сайт



Задание 1

Brucella pinnipedialis
Для рассмотрения я взял scaffold-262 длиной 48647 п.н. Затем он был прогнан через
blastx. 

Исходя из находок был выбраан зигомицет (первые три находки - зигомицеты, среди них 2 Rhizopus) Phizopus oryzae
(похоже, в таблице опечатка).
Файлы, полученные от AUGUSTUS:
augustus.aa - гипотетические белки
augustus.cdsexons - нуклеотидные последовательности экзонов
augustus.codingseq - последовательности предсказанных генов
augustus.gbrowse - всевозможные данные информация (начало и конец генов, стопкодоны, интроны, экзоны и др.) в формате GenBank
augustus.gff - полное описание генов (по сути каждому гену все его строки из .gbrowse приписаны)
augustus.gtf - .gbrowse, отсортированные по генам
Экзонная структура
ген	экзонов
g1	2
g2	2
g3	1
g4	2
g5	1
g6	1
g7	4
g8	3
g9	2
g10	1
g11	4
g12	3
g13	4
g14	3
g15	1
g16	9
g17	4
g18	1
Для первых 5 генов была проведена проверка функции при помощи blast.
g1 не дал значимых находок (1 находка гипотетического белка). Я не нашел других подтверждений тому, что это ошибочная аннтотация,
но наверное это так.
g2 имеет в своем составе домен хитин-синтазы 1 и, соответственно, много неплохих находок.

g3 имеет домен митохондриального белка-переносчика и тоже много хороших находок.

g4 не имеет консервативных доменов, но находки указывают на то, что это репликативный белок митохондрий.

g5 представляет собой домен пептидазы C19. Находки подтверждают это.

Задание 2

Для сравнения аннотаций был выбран ген гемоглобина-B (HBB).
Ген длиной 2,718 п.н. расположен на 11-ой хромосоме на позициях 5224959-5227676 (обратная цепь).



Таблица экзонов
Видно, что тут Augustus оплошал. Он считает экзоны гемоглобина B частью огромного белка с 17 экзонами.
Надо полагать, что гемоглобин B, с которым связана например серповидно-клеточная анемия хорошо изучен,
и данные о нем из RefSeq можно считать верными. Кроме того из таблицы видно, что хотя экзоны и их кодирующие
участки могут иметь любые рамки, общая длина кодирующей последоательности кратна трем. Кроме того видно, 
что у мРНК есть 5' и 3' нетранслируемые участки.

Сайт находится в стадии разработки


© 2014 Рюмин Константин