Был взят контиг NW_001914922 его последовательность: FASTA
Контиг из организма Entamoeba histolytica - дизентерийная амёба.
Домен:Эукариоты |
Тип:Амёбозои |
Класс:Tubulinea |
Отряд:Amoebida |
Семейство:Entamoebidae |
Род:Entamoeba |
Вид:Дизентерийная амёба |
Данные по контигу | |
---|---|
Длинна | 71,103 bp |
Количество CDS | 40 |
Не было обнаружено ни одного гена с альтернативным сплайсингом, поэтому был взят самый длинный ген.
Белок XP_655972.1
В качестве референсного генома для программы AUGUSTUS был взят организм Caenorhabditis elegans. параметры предсказания:
Такой референсный организм был выбран поскольку ни одного организма из группы Amoebozoa не нашлось. И был выбран хорошо изученный из группы Opisthokonta. Большинство параметров было выбрано по умолчанию. Включать UTR посчитал нецелесообразным из-за черезмерной удаленности организмов.
В результате был получен архив с файлами:
Предсказание генов в базе данных и программой Prodigal | |
---|---|
Число генов, совпадающих обоими концами | 4 |
Процент генов, совпадающих обоими концами | 7% |
Число генов с неверным N-концом | 0 |
Процент генов с неверным N-концом | 0% |
Число генов с неверным C-концом | 8 |
Процент генов с неверным C-концом | 15% |
Число несовпавших генов | 40 |
Процент несовпавших генов | 76% |
Для сравнения двух файлов: augustus.gff contig.gff был использован скрипт на Python аналогичный скрипту в предыдущем практикуме.
Результаты сравнения:
Предсказание генов в базе данных и программой Prodigal | |
---|---|
Число генов, совпадающих обоими концами | 4 |
Процент генов, совпадающих обоими концами | 7% |
Число генов с неверным N-концом | 0 |
Процент генов с неверным N-концом | 0% |
Число генов с неверным C-концом | 8 |
Процент генов с неверным C-концом | 15% |
Число несовпавших генов | 40 |
Процент несовпавших генов | 76% |
Предсказание получилось совсем некачественным. Видимо из-за дальнеродственности референсного генома. ген NW_001914922.164 из прошлого задания правильно предсказан не был (верен только -С конец).
Term 3 Main page