Предсказание генов эукариот
1. Описание контига и гена с альтернативным сплайсингом
|
Таксономия:
|
 Рис.1 Ирландский мох (
источник) |
Выданный
контиг пренадлежит
этому организму. Данные о контиге можно найти в таблице 1. В моем контиге не было изоформ,
поэтому я взял
резеврный организм,
у которого я взял изоформу, изображенную на рис.2.
| Таблица 1. Данные о контиге
|
| Идентификатор | NW_005179077
|
| Размер, пн | 187631
|
| Количество генов | 40
|
| Количество CDS | 52
|
2. Предсказание генов и белок-кодирующих участков в контиге
С помощью web-сервиса Augustus провел предсказание генов в своем
контиге. Параметры запуска указаны в таблице 2.
| Таблица 2. Параметры запуска Augustus
|
| Организм для параметров модели | Galdieria sulphuraria
|
 | Будем искать нетранслируемые
регионы в генах, чтобы лучше находить их границы. Поиск ведем по обоим цепям, потому что
аннотированы гены в обоих цепях. В нашем контиге нет аннотированных случаев альтернативного
сплайсинга, поэтому не будем включать это опцию. Позволим находить
любое количество генов и их кусков. |
В итоге получил предсказание. Папка с предсказаниями
содержит 7 файлов с разными функциями. Подробнее в таблице 3.
| Таблица 3. Типы файлов в предсказании Augustus
|
| Расширение | Описание
|
| .aa | Содержит аминокислотные последовательности всех предсказанных генов
|
| .cdsexons | Содержит нуклеотидные последовательности всех предсказанных экзонов
|
| .codingseq | Содержит нуклеотидные последовательности всех предсказанных генов
|
| .gbrowse | Содержит координаты всех предсказанных треков
|
| .gff | Содержит все предсказанные треки, с нуклеотидными и аминокислотными последовательностями предсказанных генов
|
| .gtf | Предсказание в gtf-формате
|
| .mrna | Содержит нуклеотидные последовательности мРНК с учетом некодирующих регионов |
По предсказанию в контиге находится 58 генов и 98 CDS, в полтора раза
больше, чем аннотировано. При этом совпадений генов не обнаружено. Но по CDS ситуация
улучшилась: 9 совпадают по обоим концам, 3 совпадают по N-концу, 8 - по С-, 32 CDS из
GenBank не имеют общих концов с предсказанными.
Не могу сравнить предсказание для гена из задания 1, так как брал
из другого организма.
© Maximov Vladislav, 2019.