Предсказание генов эукариот

Описание скэффолда

В этом задании использовался контиг с идентификатором NW_013577356.1, принадлежащий организму Lingula anatinaю. Его можно скачать по ссылке

Lingula anatina

Систематика:

Царство: Animalia

Тип: Brachiopoda

Класс: Lingulata

Порядок: Lingulida

Семейство: Lingulidae

Род: Lingula

Вид: Lingula anatina

Lingula anatina — плеченогие из отряда лингулид класса лингулят . Одни из древнейших плеченогих, доживший до наших дней.

Немного информации о скэффолде NW_013577356.1 :

длина: 590535 п.н.;

число генов и CDS: 32/40 соответственно;

число некодирующих РНК (ncRNA): 1;

Соответствующая запись была найдена в БД Nucleotide и открыта в геномном браузере. Далее вручную был найден ген, для которого по данным базы данных предсказывается альтернативный сплайсинг. В качестве продуктов трансляции мРНК предсказаны 3 изоформы lysosomal amino acid transporter 1.

Изображение гена, для транскрипта которого предсказан альтернативный сплайсинг

мРНК и соответствующие изоформы

Предсказание генов и белок-кодирующих областей в выданном контиге

Надо предсказать гены в выданном контиге с помощью веб-сервиса AUGUSTUS. В качестве организма, из генома которого выбирались параметры модели, были взяты Tribolium castaneum и Schistosoma mansoni. Из всех предложенных организмов ничего ближе Protostomia (первичноротые) найти не удалось, поэтому был взят Tribolium castaneum. Однако AUGUSTUS выдавал ошибку (файлов в архиве predictions.tar.gz было явно маловато), поэтому за модель был взят Schistosoma mansoni, хотя он был дальше изначально выбранного (так же как Tribolium castaneum и Lingula anatine относится к Bilateria).

Остальные параметры:

В результате были получены архивы predictions.tar.gz со следующими файлами:

для Tribolium castaneum

для Schistosoma mansoni

*.gff

предсказания генов в gff-формате

*.gtf

предсказания генов в gtf-формате

*.aa

белковые последовательности предсказанных генов в fasta-формате

*.codingseq


*.cdsexons

предсказание в виде fasta-последовательности экзонов

*.gbrowse

трек-файл для GBrowse

По принципу, описанному в предыдущем практикуме, для анализа предсказания был сделан еще один «костыль». Ген, для транскрипта которого предсказан альтернативный сплайсинг, не был предсказан AUGUSTUS.

К семестрам


© Енькова Анна, 2017