Учебный сайт Софроновой Алины
Предсказание генов у эукариот

        Целью этого практикума является определить экзон-интронную структуру гена и описать его альтернативный сплайсинг, используя программы GENSCAN и UCSC Genome Browser. Для анализа мне дан фрагмент ДНК из генома человека.

GENSCAN

        GENSCAN - программа предназначенная для предсказания интрон-экзонной структуры генов в геномах различных организмов. Подав на вход программе нашу последовательность из генома человека, мы получили вероятную интрон-экзонную структуру генов, входивших в этот участок. Результат GENSCAN представлен в Таблице 1.

Таблица 1. Экзонно-интронная структура гена в данном фрагменте ДНК человека, найденная при помощи GENSCAN

Начало Конец Цепь Тип
636 648 + начальный
4515 4551 + внутренний
4679 4730 + внутренний
6040 6163 + внутренний
10329 10515 + внутренний
14689 14856 + внутренний
19222 19433 + внутренний
20905 21054 + внутренний
24436 24468 + внутренний
24787 24905 + внутренний
28539 28778 + внутренний
31033 31195 + внутренний
31534 31631 + внутренний
31899 32096 + конечный

        Предскажем структуру гена другим способом, а именно используя геномный браузер (Genome Browser). Геномный браузер выравнивает исходный ген со всевозможными мРНК и EST последовательностями. Программа BLAT позволяет искать последовательности в геноме с учетом его фрагментации. Я ввела свой фрагмент в текстовое поле формы, выбрала поиск в геноме человека, а так же сборку hg38 (Dec. 2013). Среди находок выбрала находку с наибольшим весом и идентичностью 99,9%. Перейдя к просмотру данного фрагмента, я спрятала все опции за исключением некоторых. В итоге я получила выравнивания моего гена со сплайсированными EST и мРНК человека. Проанализируем для мРНК последовательностей (Рис.1).


Рис.1. Выравнивания данного гена и мРНК человека. Красная рамка - пример кассетного экзона, зеленая - альтернативного донорного сайта.

        Самая распространенная форма альтернативного сплайсинга у млекопитающих это кассетный экзон. На Рис.1 я выделила красной рамки как раз такие участки. Транскрипт AL833489 включает экзон, а все остальные находящиеся в рамке нет. Так же экзон встречается в мРНК AK056309, в то время как ни в одной другой найденной не стречается. С некоторой натяжкой последовательности в зеленой рамке иллюстрируют альтернативный донорный сайт.

        Рассмотрим EST последовательности.


Рис.2. Выравнивания данного гена и сплайсированных EST. Красная рамка - пример кассетного экзона.

        Анализируя EST последовательности приходится смотреть лишь на внутренние экзоны, так как внешние обрываются в произвольно обрываются. В общем, мы видим довольно схожую картину для всех последовательностей, лишь в некоторых местх я обнаружила кассетный экзон (например транскрипт имеющий экзон BG389344).

BLASTX

        Мне дан фрагмент ДНК из генома киви Actinidia chinensis. Проаннотируем этот фрагмент, определим интрон-экзонную структуру генов и их функцию. При запуске blastx я исключила поиск по моделям и пробам среды (Models (XM/XP) и Uncultured/environmental sample sequences). Искала тоьлко в базе данных Swiss-Prot, чтобы использовать только экспериментально наблюдавшиеся белки. Ограничила поиск только белками растений (Viridiplantae) и исключить из поиска геном винограда Vitis vinifera. В результате было найдено 7 генов. Подробная информация о них приведена в Таблице 2,3,4,5,6,7.

Таблица 2. Экзонно-интронная структура гена, кодирующего ингебитор диссоциации ГДФ, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
11507 11605 + начальный
11943 12044 + внутренний
12318(*) 12440(*) +(*) внутренний(*)
12528(*) 12725(*) +(*) внутренний(*)
14213 14326 + внутренний
14416 14508 + внутренний
14597(*) 14668(*) +(*) внутренний(*)
14789(*) 14893(*) +(*) внутренний(*)
20009 20176 + внутренний
21050(*) 21283(*) +(*) внутренний(*)
21365(*) 21454(*) +(*) внутренний(*)
23467 23565 + внутренний
26222(*) 26287(*) +(*) внутренний(*)
26387(*) 26470(*) +(*) внутренний(*)
26563(*) 26686(*) +(*) внутренний(*)
26806(*) 26970(*) +(*) внутренний(*)
30196 30309 + внутренний
30398 30481 + внутренний
30582(*) 30650(*) +(*) внутренний(*)
30759(*) 30860(*) +(*) внутренний(*)
31372 31509 + внутренний
32362(*) 32571(*) +(*) внутренний(*)
32656(*) 32733(*) +(*) конечный(*)
(*)- экзоны, полученные вручную, путем разбиения. Я разбивала, если встерчался участок, в котором очень много стоп-кодонов и нет достоверного выравнивания с белком (огромное количество гэпов).

       Очень не типично существование генов у эукариот, не содержащие никакие интроны, а лишь один экзон. В данном случае такие гены нашлись (Таблица 3,5,6).

Таблица 3. Экзонно-интронная структура гена, кодирующего белок Ycf2, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
24498 24373 + начальный

Таблица 4. Экзонно-интронная структура гена, кодирующего фактор элонгации Tu, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
72906 73070 + начальный
73890 74297 + конечный

Таблица 5. Экзонно-интронная структура гена, кодирующего фактор транскрипции MYB1R1, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
40396 40590 + начальный

Таблица 6. Экзонно-интронная структура гена,кодирующего фактор транскрипции DIVARICATA, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
40393 40542 + начальный

Таблица 7. Экзонно-интронная структура гена,кодирующего фактор элонгации 1-альфа, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
72609 73073 + начальный
73818 74666 + конечный

Таблица 8. Экзонно-интронная структура гена,кодирующего белок-рецептор HDEL, в данном фрагменте ДНК киви, найденная при помощи blastx

Начало Конец Цепь Тип
94229 94176 - конечный
94569(*) 94640(*) -(*) внутренний(*)
94241(*) 94303(*) -(*) внутренний(*)
98666 98544 - внутренний
100454 100146 - внутренний
102908 102843 - внутренний
104038 103943 - начальный
(*)- экзоны, полученные вручную, путем разбиения. Я разбивала, если встерчался участок, в котором очень много стоп-кодонов и нет достоверного выравнивания с белком (огромное количество гэпов).


Вернуться к 3 семестру

© Алина Софронова, 2014
Дата последнего изменения: 23.11.2014