Предсказание генов у эукариот

GENSCAN

С помощью сервиса GENSCAN была получена информация об имеющихся в заданной последовательности экзонах. Полученные данные показаны в таблице 1 и таблице 2.

Таблица 1. Экзоны первого гена
Тип Цепь Начало Конец
Начальный + 5100 5165
Внутренний + 8194 8245
Внутренний + 11322 11518
Внутренний + 12313 12389
Внутренний + 12742 12771
Внутренний + 14585 14664
Терминальный + 18394 18563
Таблица 2. Экзоны второго гена
Тип Цепь Начало Конец
Терминальный - 19171 19143
Внутренний - 19435 19306
Внутренний - 20573 20482

Genome Browser

С помощью инструмета BLAT на сайте Genome Browser было получено выравнивание заданной последовательности с геномом человека. Была выбрна первая находка с совпадением 100%. Расположение данной последовательности относительно генома показано на рис.1.


Рис.1. Расположение данной последовательности относительно генома

В EST и мРНК гена, выравнявшегося с данной последовательностью, присутствуют примеры альтернативного сплайсига. На рис.2 и 3 показаны найденные мною примеры. К сожалению, сделать изображение длиной в ген проблематично, так как длина выравнивания близка к 25000 нуклеотидам и при таком увеличении экзоны сложно рассмотреть.


Рис.2. Кассетные экзоны и альтернативные донорные сайты. Касетные экзоны обведены красной рамкой (не все, только примеры), мРНК FW406917-FW406918, AY500353-DQ229900. Альтернативные донорные сайты обведены зеленой рамкой, мРНК FW406912-FW406913-FW406914, AB021221-AF091352.

Рис.3. Альтернативные акцепторные сайты. Обведены голубой рамкой. мРНК FW406918-JA10025.

BLASTX

Для выполнения задания использовался фрагмент генома киви (Actinidia chinensis). Для аннотации был проведен blastx данной последовательности против банков RefSeq и Swissprot. Если в выравнивании стояла звездочка (*), то экзон разбивался на два. Всего с разной степенью точности удалось предсказать 3 гена, причем поиск по базе RefSeq дает больше находок по третьему гену, а Swissprot - по второму. В таблицe 3 приведена информация о предсказанных генах.


Рис.4. Результаты Blast-X
Таблица 3. Информация о предсказанных генах >
Координата начала экзона Координата конца экзона цепь
Фукозилтрансфераза (Fucosyltransferase 13)
54118 54366 -
49172 48999 -
48286 47726 -
Неизвестный белок
29840 30793 +
30861 31676 +
Белок из семейства ДНК/РНК полимераз (DNA/RNA polymerases superfamily protein)
66079 66331 +
78995 79376 +
79584 80063 +
80129 81295 +
87459 87621 +

Следует заметить, что в гене белка ДНК/РНК полимераз первый экзон, возможно, принадлежит совершенно другому гену. Этот экзон выравнивается с серединой белка из генома Theobroma cacao и некоторых других растений, что свидетельствует либо о дупликации этого участка генома, либо о наличии другого гена.

© Маслова Валентина, 2014
Последнее изменение: 24.09.2014