Предсказание генов эукариот
|
|
Третий семестр
Главный сайт |
Задание 1 Brucella pinnipedialisДля рассмотрения я взял scaffold-262 длиной 48647 п.н. Затем он был прогнан через blastx. Исходя из находок был выбраан зигомицет (первые три находки - зигомицеты, среди них 2 Rhizopus) Phizopus oryzae (похоже, в таблице опечатка). Файлы, полученные от AUGUSTUS: augustus.aa - гипотетические белки augustus.cdsexons - нуклеотидные последовательности экзонов augustus.codingseq - последовательности предсказанных генов augustus.gbrowse - всевозможные данные информация (начало и конец генов, стопкодоны, интроны, экзоны и др.) в формате GenBank augustus.gff - полное описание генов (по сути каждому гену все его строки из .gbrowse приписаны) augustus.gtf - .gbrowse, отсортированные по генам Экзонная структура ген экзонов g1 2 g2 2 g3 1 g4 2 g5 1 g6 1 g7 4 g8 3 g9 2 g10 1 g11 4 g12 3 g13 4 g14 3 g15 1 g16 9 g17 4 g18 1 Для первых 5 генов была проведена проверка функции при помощи blast. g1 не дал значимых находок (1 находка гипотетического белка). Я не нашел других подтверждений тому, что это ошибочная аннтотация, но наверное это так. g2 имеет в своем составе домен хитин-синтазы 1 и, соответственно, много неплохих находок. g3 имеет домен митохондриального белка-переносчика и тоже много хороших находок. g4 не имеет консервативных доменов, но находки указывают на то, что это репликативный белок митохондрий. g5 представляет собой домен пептидазы C19. Находки подтверждают это. Задание 2 Для сравнения аннотаций был выбран ген гемоглобина-B (HBB). Ген длиной 2,718 п.н. расположен на 11-ой хромосоме на позициях 5224959-5227676 (обратная цепь). Таблица экзонов Видно, что тут Augustus оплошал. Он считает экзоны гемоглобина B частью огромного белка с 17 экзонами. Надо полагать, что гемоглобин B, с которым связана например серповидно-клеточная анемия хорошо изучен, и данные о нем из RefSeq можно считать верными. Кроме того из таблицы видно, что хотя экзоны и их кодирующие участки могут иметь любые рамки, общая длина кодирующей последоательности кратна трем. Кроме того видно, что у мРНК есть 5' и 3' нетранслируемые участки. |
Сайт находится в стадии разработки © 2014 Рюмин Константин |