|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
Предсказание генов у эукариот В предыдущей работе была проведена работа по предсказанию генов у прокариот. В этой работе будут рассмотрены фрагменты ДНК из геномов нескольких эукариотов, для которых с помощью программ GENSCAN и UCSC Genome Browser, а также BLASTX будут предсказаны гены, закодированных в данных фрагментах, определены экзон-интронные схемы генов и описан их альтеранативный сплайсинг. Программы GENSCAN и UCSC Genome BrowserБыл рассмотрен фрагмент ДНК из генома человека.
Программа GENSCAN позволила получить следующую информацию: Таблица 1. Информация об экзонах в найденном гене человека, полученная с помощью программы GENSCAN
Дальше предсказание экзон-интронной схемы гена для данного фрагмента проведено с помощью программы UCSC Genome Browser. Данная программа позволяет искать последовательности с учетом ее возможной фрагментированности. В результате работы данной программы с определенными параметрами: «pack» для Blat Sequence в группе Mapping and Sequencing Tracks, для Human mRNAs и Spliced ESTs в группе mRNA and EST Tracks, для всего остального "hide", были получены участки гена, предсказанные на основе мРНК и EST (короткие фрагменты клонированной мРНК). При изучении полученных участков (см.рис.1) было определено 6 экзонов и было найдено несколько примеров альтернативного сплайсинга с участием кассетных экзонов. Кассетный экзон – это кодирующая последовательность гена, окруженная с двух сторон интронами, которая может не включаться в последовательность мРНК при сплайсинге. На рисунке 1 оранжевыми рамками выделены примеры, где кассетные экзоны включены и не включены в последовательность мРНК. Рис.1. Фрагмент отображения последовательностей мРНК и EST, соответствующих исследуемому фрагменту ДНК человека. Вверху картинки экзоны пронумерованы в соответствии с таблицей 1. Оранжевыми рамками выделены примеры альтернатив сплайсинга типа кассетный экзон. Рисунок получен с помощью программы UCSC Genome Browser. По результатам работы вышеописанных программ и анализа полученных данных можно сделать вывод, что рассматриваемый фрагмент ДНК из генома человека содержит в себе 1 ген с 6 экзонами (их координаты см. в таблице 1), из которых два (№ 3 и 4) представляют собой кассетные экзоны. Программа BLASTXДалее был рассмотрен фрагмент ДНК из генома киви Actinidia chinensis (фрукт) длинной 104 833 нуклеотида. Так как геном киви, в отличии от генома человека, не является хорошо аннотированным, то для предсказания генов этого фрагмента использовалась программа BLASTX, а не ранее использованные GENSCAN и UCSC Genome Browser. Программа BLASTX выполняет поиск гомологичных последовательностей белков, соответствующих участков исследуемого фрагмента ДНК. Поиск проводился со следующими параметрами: исключение поиска по моделям и пробам среды, ограничение поиска по белкам растений, исключение поиска по геному винограда, использование стандартного генетического кода. Также поиск проводился несколько раз по двум банкам: Refseq и SwissProt. На основании найденных гомологичных последовательностей было предсказано 4 гена, в некоторых из которых возможен сплайсинг. Дальнейшее предсказания функций генов и их экзон-интронной структуры происходило на основании лучшей находки в группе, соответствующей каждому гену. Первый ген расположен с 7 351 по 11 106 нуклеотид и предположительно кодирует белок семейства ферментов Р450 (cytochrome P450) – это фермент, который каталицирует множество реакций расщипления и окисления. Ген содержит 2 экзона, информация о которых содержится в таблице 2. Таблица 2. Информация об экзонах предполагаемого гена, кодирующего белок семейства Р450, полученная с помощью программы BLASTX
Второй ген кодирует белок 1-аминоциклопропан-1-карбоксил оксидаза – этилен-формирующий энзим. Координаты данного гена: 13 441-60 216. Ген содержит 3 экзона, информацию о них см. в таблице 3. Таблица 3. Информация об экзонах предполагаемого гена, кодирующего белок 1-аминоциклопропан-1-карбоксил оксидазу, полученная с помощью программы BLASTX
Для следующего гена, гена № 3, было предположение о наличии в нем альтернативного сплайсинга, потому что было найдено 22 гомологичных последовательности, в которых представлено разное количество экзонов (графическое представление см. здесь), зависимости между наличием опредеоленных экзонов и закодированным белком выявлено не было. Поэтому предсказать варианты альтернативного сплайсинга на основе этих данных затруднительно. В связи с этим была взята последовательность, содержащая наибольшее возможное количество экзонов – 6. Выбранный ген кодирует киназу 1, фосфорилирующую свингозиновые основания (Sphingoid long-chain bases kinase 1), он расположен с 81 505 по 146 535 нуклеотид. В таблице 4 находится информация о экзонах этого гена. Таблица 3. Информация об экзонах предполагаемого гена, кодирующего белок 1-аминоциклопропан-1-карбоксил оксидазу, полученная с помощью программы BLASTX
Для последнего гена аналогично предыдущему была выбрана последовательность, содержащая наибольшее количество экзонов, а именно 8. Этот ген, расположенный с 199 990 нуклеотид по 251 094, предположительно кодирует фермент копропорфириноген-III оксидазу (сoproporphyrinogen-III oxidase). Информация о 8 экзонах данного гена находится в таблице 5. Таблица 3. Информация об экзонах предполагаемого гена, кодирующего белок 1-аминоциклопропан-1-карбоксил оксидазу, полученная с помощью программы BLASTX
|
||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
© Alyona Koryagina aakor@fbb.msu.ru
Дата последнего изменения: 22.12.2014 |