Главная
Семестры
Обо мне
Ссылки

Предсказание генов эукариот


1. Описание контига и гена с альтернативным сплайсингом

Таксономия:

Рис.1 Ирландский мох ( источник)
Выданный контиг пренадлежит этому организму. Данные о контиге можно найти в таблице 1. В моем контиге не было изоформ, поэтому я взял резеврный организм, у которого я взял изоформу, изображенную на рис.2.
Таблица 1. Данные о контиге
Идентификатор NW_005179077
Размер, пн 187631
Количество генов 40
Количество CDS 52

Рис.2 Альтернативный сплайсинг у резервного организма

2. Предсказание генов и белок-кодирующих участков в контиге

С помощью web-сервиса Augustus провел предсказание генов в своем контиге. Параметры запуска указаны в таблице 2.
Таблица 2. Параметры запуска Augustus
Организм для параметров модели Galdieria sulphuraria
Будем искать нетранслируемые регионы в генах, чтобы лучше находить их границы. Поиск ведем по обоим цепям, потому что аннотированы гены в обоих цепях. В нашем контиге нет аннотированных случаев альтернативного сплайсинга, поэтому не будем включать это опцию. Позволим находить любое количество генов и их кусков.
В итоге получил предсказание. Папка с предсказаниями содержит 7 файлов с разными функциями. Подробнее в таблице 3.
Таблица 3. Типы файлов в предсказании Augustus
Расширение Описание
.aa Содержит аминокислотные последовательности всех предсказанных генов
.cdsexons Содержит нуклеотидные последовательности всех предсказанных экзонов
.codingseq Содержит нуклеотидные последовательности всех предсказанных генов
.gbrowse Содержит координаты всех предсказанных треков
.gff Содержит все предсказанные треки, с нуклеотидными и аминокислотными последовательностями предсказанных генов
.gtf Предсказание в gtf-формате
.mrna Содержит нуклеотидные последовательности мРНК с учетом некодирующих регионов
По предсказанию в контиге находится 58 генов и 98 CDS, в полтора раза больше, чем аннотировано. При этом совпадений генов не обнаружено. Но по CDS ситуация улучшилась: 9 совпадают по обоим концам, 3 совпадают по N-концу, 8 - по С-, 32 CDS из GenBank не имеют общих концов с предсказанными.
Не могу сравнить предсказание для гена из задания 1, так как брал из другого организма.