Учебный сайт Саши Погорельской Эмблема
Главная Семестры Скрипты Обо мне Ссылки
1 семестр
2 семестр
3 семестр
4 семестр
7 семестр
Строение
Формы
Комплексы
Банки
EMBOSS
BLAST
Prediction
Чтения
У прокариот У эукариот

Предсказание генов у эукариот

Задача практикума - описать структуру данной мне последовательности гена эукариотического организма.

С помощью программы GENSCAN можно предсказать вероятный набор экзонов. В таблице 1 приведен результат для моей последовательности.

Таблица 1. Результат работы программы GENSCAN

0

В базе Genome Browser содержатся различные секвенированные последовательности, картированные на геном. Одна из опций - использование программы BLAT для поиска последовательности по геному, но с учетом возможной фрагментации.

Для изучения одного из генов человека, использовалась сборка hg38 (Dec. 2013). Для одна из находок программы BLAT значение IDENTITY было 100%. Это участок 9 хромосомы с 2621000 по 2654499 нуклеотиды, + цепь. На рисунках 1 и 2 показано выравнивание послдовательностей РНК и EST (expresstion sequence tag – цитоплазматическая РНК). То есть последовательности EST это набр экзонов гена.

1

Рисунок 1. Результат работы программы BLAT, картирование mRNA на ген

На рисунке 1 видно, что третий и четвертый экзоны (справа) присутствуют не во всех мРНК. Например, он есть в мРНК с идентификаторами D16494 и L20470, но их нет в AK092381 и AX747508. Это пример альтернативного сплайсинга, кассетного экзона.

2

Рисунок 2. Результат работы программы BLAT, картирование EST на ген

Предыдущее предсказание двух кассетных экзонов подтвержатся и рисунком 2. Есть EST, содержащие третий и четвртый экзон (DB269359, BP284940) и не содержащие (DA337087, HY132499). Есть примеры отсутствия только четвертого экзона (идентификаторы DA50245, BX333793).

Случай наличия четвертого экзона без третьего я не нашла, возможно это означает функциональную взаимосвязь фрагментов белка, кодируюемых этими экзонами.

Третьим заданием было определить свойства фрагмента генома киви с помощью программы blastx. Я сделала поиск по банку данных SwissProt.

Программой было найдено несколько гомологов данной мне последовательности, все использованные находки имеют E-value ниже 5e-07. Всего найдено 7 генов, кодирующих белки, некоторые из них предположительно имеют альтернативный сплайсинг (5 и 7 белки в в таблице). Более подробная информация об этих генах приведена в таблице с указанием координат предполагаемых экзонов в исходной последовательности. Для определения этих координат использовались лучшие по E-value находки.





© Pogorelskaya Sasha Last modification date: 19.02.15