Предсказание генов эукариот
Описание скэффолда
В этом задании использовался контиг с идентификатором NW_013577356.1,
принадлежащий организму Lingula anatinaю. Его можно скачать по ссылке
Lingula anatina
Систематика:
Царство: Animalia
Тип:
Brachiopoda
Класс:
Lingulata
Порядок:
Lingulida
Семейство:
Lingulidae
Род: Lingula
Вид: Lingula anatina
Lingula anatina
—
плеченогие
из отряда
лингулид
класса
лингулят
. Одни из древнейших плеченогих, доживший до наших дней.
Немного информации о скэффолде NW_013577356.1
:
длина: 590535 п.н.;
число генов и CDS: 32/40 соответственно;
число некодирующих РНК (ncRNA): 1;
Соответствующая запись была найдена в БД Nucleotide и открыта в геномном
браузере. Далее вручную был найден ген, для которого по данным базы данных
предсказывается альтернативный сплайсинг. В качестве продуктов трансляции
мРНК предсказаны 3 изоформы lysosomal amino acid transporter 1.
Изображение гена, для транскрипта которого предсказан альтернативный
сплайсинг
мРНК и соответствующие изоформы
Предсказание генов и белок-кодирующих областей в выданном контиге
Надо предсказать гены в выданном контиге с помощью веб-сервиса AUGUSTUS. В
качестве организма, из генома которого выбирались параметры модели, были
взяты Tribolium castaneum и Schistosoma mansoni. Из всех предложенных
организмов ничего ближе
Protostomia
(первичноротые) найти не удалось, поэтому был взят Tribolium castaneum.
Однако AUGUSTUS выдавал ошибку (файлов в архиве predictions.tar.gz было
явно маловато), поэтому за модель был взят Schistosoma mansoni, хотя он был
дальше изначально выбранного (так же как Tribolium castaneum и Lingula
anatine относится к Bilateria).
Остальные параметры:
В результате были получены архивы predictions.tar.gz со следующими файлами:
для Tribolium castaneum
для Schistosoma mansoni
*.gff
|
предсказания генов в gff-формате
|
*.gtf
|
предсказания генов в gtf-формате
|
*.aa
|
белковые последовательности предсказанных генов в
fasta-формате
|
*.codingseq
|
|
*.cdsexons
|
предсказание в виде fasta-последовательности экзонов
|
*.gbrowse
|
трек-файл для GBrowse
|
По принципу, описанному в предыдущем практикуме, для анализа предсказания
был сделан еще один «костыль». Ген, для транскрипта которого предсказан
альтернативный сплайсинг, не был предсказан AUGUSTUS.