Предсказание генов у эукариот

Для работы мне была выдана следующая последовательность гена человека.

Для начала с помощью GENSCAN был получен вероятный набор экзонов. Результаты работы этой программы можно увидеть в таблице 1

Таблица 1. Предсказанные с помощью GENSCAN экзоны в выданном мне гене.
Тип Цепь Начало Конец
1 Конечный - 841 720
2 Внутренний - 1844 1675
3 Внутренний - 3324 2840
4 Начальный - 4738 3671

на сатте Genome Browser с помощью инструмента BLAT было получено выравнивание данной последовательности на геном человека, результат можно увиджеть на рисунке 1.

Экзон-интронная структура данного контига Рисунок 1. Результат работы сервиса BLAT

Нужно было найти различные виды альтеорнативного сплайсинга, так как эих сложно увидеть на таком масштабе, то на рисунке 2, при приближении, показаны следующие типы альтернативного сплайсинга: кассетные экзоны (синяя рамка), альтернативные донорные сайты (красная рамка), альтернативные акцепторные сайты (жёлтая рамка) и удержанный интрон (зелёная рамка).

различные виды альтернативного сплайсинга Рисунок 2. различные виды альтернативного спласинга. Рамками различного цвета помечены следающие типа: кассетный экзон - синий, альтернативный донорный сайт - красный, альтернативный акцепторный сайт - жёлтый, удержанный интрон - зелёный.

Для следующего задания использовалась последовательность части генома Actinidia chinensis. С помощью blastx был проведён бласт по банку swissprot (рисунок 3), соответсвенно составленные на основе этих выравниваний предсказанные гены представлены в таблице 2

Рисунок 3. Результаты Blast-X

Таблица 2. Предсказанные гены и их экзонная структура
номер экзона Начало экзона Конец Экзона
Убиквитин карбоксил-гидролаза (Ubiquitin carboxyl-terminal hydrolase)
1 728 937
2 4170 4229
3 5658 5738
4 6531 6623
5 6734 7117
6 7234 7404
7 9560 9655
8 9737 9959
Предполагаемый ДНК-связывающий белок(Putative DNA-binding protein ESCAROLA)
1 19759 19427
Адаптерный белок комплекса AP-4, субъединица μ (Adaptor protein complex AP-4 subunit μ, закодирован на обратной цепи)
1 29327 29229
2 29777 29697
3 29940 29871
4 30145 30050
5 31245 30895
6 31454 31343
7 31965 31870
8 33229 33088
9 33430 33317
10 34151 33927
11 34653 34546
12 36442 36410
Шаперон dnaj 49 (Chaperone protein dnaJ 49, закодирован на обратной цепи)
1 41810 41544
Механочувствительный илонный канал (Mechanosensitive ion channel protein 2, закодирован на обратной цепи)
1 46389 46237
2 47697 47635
3 48435 48296
4 48716 48504
5 49025 48861
6 49220 49382
7 50590 50477
8 50880 50674
Предполагаемя, сходная с убиквитином, с пецефичная протеаза 2B (Probable ubiquitin-like-specific protease 2B, закодирован на обратной цепи)
1 61806 61340
2 65272 65144
3 67467 67373
4 73820 73731
5 73974 73924
6 74267 74067
7 74759 74622
8 77663 77547
9 78434 78213
10 82228 82139
© Демкив Андрей 2013 Дата последнего изменения: 29.05.2015