Задания по предсказанию генов эукариот

Задание 1.Описание выданного контига и одного из генов на нем, для которого предсказан альтернативный сплайсинг

Выданный мне контиг NW_005819511 принадлежит Latimeria chalumnae (Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi; Coelacanthiformes; Coelacanthidae; Latimeria).
Latimeria chalumnae — один из двух видов рыб рода латимерия. Встречается в водах Индийского океана. Одна популяция обитает у островов Большой Комор и Анжуан (Коморские острова), другая популяция — у Южной Африки, Мадагаскара и Мозамбика. Морская глубоководная демерсальная рыба длиной до 168 см. Окрас темный, серо-синий с неправильной формы белыми пятнами по всему телу, исключая плавники и хвост. Ведет малоподвижный ночной образ жизни, хищник. Единственный в настоящее время представитель отряда целкантообразных и надотряда кистеперых рыб. До открытия latimeria chalumnae считалось, что кистеперые вымерли. (wiki)

Контиг NW_005819511 имеет длину 1263286 bp, 38 генов и 40 белок-кодирующих последовательностей (CDS).
[ссылка на fasta-файл NW_005819511]
[ссылка на источник рисунка ниже]



Предсказание альтернативного сплайсинга

Задание 2.Предскажите гены и белок-кодирующие области в выданном контиге

Для выполнения этого задания было необходимо воспользоваться сервером AUGUSTUS в режиме prediction.


Параметры ввода: в качестве организма, из генома которого выбирались параметры модели, был взят Danio rerio,остальные параметры, за исключением alternative transcripte(medium), были взяты по умолчанию.

В результате был получен файл для скачивания predictions.tar.gz. В нем содержались файлы следующих расширений:

AUGUSTUS предсказал 51 ген, в то время как в файле GenBank всего 38 генов. Но ген - LOC102365752, являющийся вариантом альтернативного сплайсинга, сервером AUGUSTUS предсказан не был.