Предсказание генов у эукариотДля фрагмента ДНК человека с помощью программ GENSCAN и UCSC Genome Browser определена экзон-интронная структура гена и описан его альтернативный сплайсинг. GENSCAN Исследуемая последовательность была подана на вход программе GENSCAN. Выбраны настройки для позвоночных (Vertebrate). В результате был предсказан один ген. Информация о его экзонах получена в виде таблицы. Часть этой информации можно увидеть в таблице 1. Были исключены записи, не соответствующие экзонам: PlyA (сайт полиаденилирования) и Prom (промотор). Таблица 1. Информация об экзонах гена человека, предсказанного с помощью GENSCAN
Genome Browser Затем предсказание экзон-интронной структуры того же участка проводилось с помощью программы BLAT, которая доступна с сайта UCSC Genome Browser. Данная программа позволяет искать последовательности в геноме с учетом его возможной фрагментированности. Последовательность ДНК была помещена в текстовое поле формы, выбран поиск в геноме человека, сборка hg38 (Dec. 2013). Получен список найденных фрагментов генома, из них выбран фрагмент, имеющий 100% идентичность с исследуемой последовательностью и наибольший вес (18958). Перейти к просмотру выбранного найденного фрагмента генома человека можно, нажав гиперссылку browser. Рассматривались участки гена, предсказанные на основе мРНК и EST (короткие фрагменты (клонированной) мРНК). Для отображения найденной последовательности и этих участков нужно поставить на "pack" переключатель Blat Sequence в группе Mapping and Sequencing Tracks, а также переключатели Human mRNAs и Spliced ESTs в группе mRNA and EST Tracks, остальные переключатели нужно поставить на "hide". Затем нужно нажать кнопку "refresh" (она находится внизу страницы). На полученном отображении последовательностей мРНК и EST, соответствующих нашему фрагменту ДНК, найдено несколько примеров альтернативного сплайсинга. Кассетные экзоны найдены как среди мРНК (например, между последовательностями AY940729 и J02931), так и среди EST (например, между последовательностями DA029400 и BP220588). Другим примером может послужить альтернативный донорный сайт, образованный последовательностями DA029400 и BI668899. На рис. 1 можно увидеть эти и другие примеры альтернативного сплайсинга данной последовательности. Рис. 1. Фрагмент отображения последовательностей мРНК и EST, соответствующих исследуемуму фрагменту ДНК человека. Получено с помощью Genome Browser и программы BLAT. В красные рамки обведены кассетные экзоны. В зеленые рамки обведены участки последовательностей, составляющие альтернативный донорный сайт. BLASTX Предсказание генов и экзон-интронной структуры проводилось для фрагмента ДНК киви (Actinidia chinensis). Геном киви не является хорошо аннотированным (в отличие от генома человека), поэтому для предсказания генов фрагмента генома этого растения невозможно использовать GENSCAN или Genome Browser. Поэтому разметка экзон-интронной структуры генов этого фрагмента производилась с помощью BLASTX (поиск гомологичных последовательностей белков, соответствующих участкам исследуемого фрагмента ДНК). При поиске был исключён (Exclude) поиск по моделям и пробам среды (галочки возле Models (XM/XP) и Uncultured/environmental sample sequences). Поиск ограничен белками растений (Viridiplantae), исключён геном винограда Vitis vinifera. Поиск проводился по банку SwissProt, использовался стандартный генетический код. На основе найденных гомологичных последовательностей предсказано 5 генов данного фрагмента. Использовались гомологи с E-value меньше 0.001, предсказания каждого гена составлялись на основе выравнивания с наилучшим гомологом в группе, соответствующей этому гену. Предсказание предполагаемого гена галактуроносилтрансферазы (Probable galacturonosyltransferase) было составлено на основе лучшего из двух найденных гомологов, гена белка-шаперона - из 14-ти, белка EID1-like F-box - из 2-ух, предполагаемого гена сахаропин дегидрогеназоподобной оксидоредуктазы - на основе одного гомолога и, наконец предсказание гена белка, содержащего пентатрисопептидные повторы - на основе лучшего из более 50-ти найденных гомологов. Участки перекрытия приписывались экзонам, в которых эти участки составляли наилучшее выравнивание с соответствующим фрагментом белка. Экзон гена галактуроносилтрансферазы, содержащий стоп-кодон, был разделен на два. Для гена белка-шаперона предсказано две возможные изоформы. Информацию о предсказанной экзон-интронной структуре предполагаемых генов можно увидеть на таблицах 2-6. Таблица 2. Информация об экзонах гена галактуроносилтрансферазы (Probable galacturonosyltransferase) киви, предсказанного с помощью BLASTX
Таблица 3. Информация об экзонах двух возможных изоформ гена белка-шаперона (Chaperone protein) киви, предсказанного с помощью BLASTX
Таблица 4. Информация об экзонах гена белка EID1-like F-box киви, предсказанного с помощью BLASTX
Таблица 5. Информация об экзонах гена сахаропин дегидрогеназоподобной оксидоредуктазы (Probable mitochondrial saccharopine dehydrogenase-like oxidoreductase) киви, предсказанного с помощью BLASTX
Таблица 6. Информация об экзонах гена белка, содержащего пентатрисопептидные повторы (Pentatricopeptide repeat-containing protein) киви, предсказанного с помощью BLASTX
© Shvetsova Ekaterina, FBB MSU, 2013 |