Был взят контиг NW_001914922 его последовательность: FASTA
Контиг из организма Entamoeba histolytica - дизентерийная амёба.
![]() |
|---|
| Домен:Эукариоты |
| Тип:Амёбозои |
| Класс:Tubulinea |
| Отряд:Amoebida |
| Семейство:Entamoebidae |
| Род:Entamoeba |
| Вид:Дизентерийная амёба |
| Данные по контигу | |
|---|---|
| Длинна | 71,103 bp |
| Количество CDS | 40 |
Не было обнаружено ни одного гена с альтернативным сплайсингом, поэтому был взят самый длинный ген.
Белок XP_655972.1
В качестве референсного генома для программы AUGUSTUS был взят организм Caenorhabditis elegans. параметры предсказания:
Такой референсный организм был выбран поскольку ни одного организма из группы Amoebozoa не нашлось. И был выбран хорошо изученный из группы Opisthokonta. Большинство параметров было выбрано по умолчанию. Включать UTR посчитал нецелесообразным из-за черезмерной удаленности организмов.
В результате был получен архив с файлами:
| Предсказание генов в базе данных и программой Prodigal | |
|---|---|
| Число генов, совпадающих обоими концами | 4 |
| Процент генов, совпадающих обоими концами | 7% |
| Число генов с неверным N-концом | 0 |
| Процент генов с неверным N-концом | 0% |
| Число генов с неверным C-концом | 8 |
| Процент генов с неверным C-концом | 15% |
| Число несовпавших генов | 40 |
| Процент несовпавших генов | 76% |
Для сравнения двух файлов: augustus.gff contig.gff был использован скрипт на Python аналогичный скрипту в предыдущем практикуме.
Результаты сравнения:
| Предсказание генов в базе данных и программой Prodigal | |
|---|---|
| Число генов, совпадающих обоими концами | 4 |
| Процент генов, совпадающих обоими концами | 7% |
| Число генов с неверным N-концом | 0 |
| Процент генов с неверным N-концом | 0% |
| Число генов с неверным C-концом | 8 |
| Процент генов с неверным C-концом | 15% |
| Число несовпавших генов | 40 |
| Процент несовпавших генов | 76% |
Предсказание получилось совсем некачественным. Видимо из-за дальнеродственности референсного генома. ген NW_001914922.164 из прошлого задания правильно предсказан не был (верен только -С конец).
Term 3 Main page