Предсказание генов эукариот
1. Описание контига и гена с альтернативным сплайсингом
Таксономия:
|
 Рис.1 Ирландский мох (
источник) |
Выданный
контиг пренадлежит
этому организму. Данные о контиге можно найти в таблице 1. В моем контиге не было изоформ,
поэтому я взял
резеврный организм,
у которого я взял изоформу, изображенную на рис.2.
Таблица 1. Данные о контиге
|
Идентификатор | NW_005179077
|
Размер, пн | 187631
|
Количество генов | 40
|
Количество CDS | 52
|
2. Предсказание генов и белок-кодирующих участков в контиге
С помощью web-сервиса Augustus провел предсказание генов в своем
контиге. Параметры запуска указаны в таблице 2.
Таблица 2. Параметры запуска Augustus
|
Организм для параметров модели | Galdieria sulphuraria
|
 | Будем искать нетранслируемые
регионы в генах, чтобы лучше находить их границы. Поиск ведем по обоим цепям, потому что
аннотированы гены в обоих цепях. В нашем контиге нет аннотированных случаев альтернативного
сплайсинга, поэтому не будем включать это опцию. Позволим находить
любое количество генов и их кусков. |
В итоге получил предсказание. Папка с предсказаниями
содержит 7 файлов с разными функциями. Подробнее в таблице 3.
Таблица 3. Типы файлов в предсказании Augustus
|
Расширение | Описание
|
.aa | Содержит аминокислотные последовательности всех предсказанных генов
|
.cdsexons | Содержит нуклеотидные последовательности всех предсказанных экзонов
|
.codingseq | Содержит нуклеотидные последовательности всех предсказанных генов
|
.gbrowse | Содержит координаты всех предсказанных треков
|
.gff | Содержит все предсказанные треки, с нуклеотидными и аминокислотными последовательностями предсказанных генов
|
.gtf | Предсказание в gtf-формате
|
.mrna | Содержит нуклеотидные последовательности мРНК с учетом некодирующих регионов |
По предсказанию в контиге находится 58 генов и 98 CDS, в полтора раза
больше, чем аннотировано. При этом совпадений генов не обнаружено. Но по CDS ситуация
улучшилась: 9 совпадают по обоим концам, 3 совпадают по N-концу, 8 - по С-, 32 CDS из
GenBank не имеют общих концов с предсказанными.
Не могу сравнить предсказание для гена из задания 1, так как брал
из другого организма.
© Maximov Vladislav, 2019.