Практикум 11
Предсказание генов прокариот
Для выполнения задания был выбран геном коронавируса тяжелого острого респираторного синдрома (SARS) (NC_004718.3).
Таксономия: Viruses; ssRNA viruses; ssRNA positive-strand viruses, no DNA stage; Nidovirales; Coronaviridae; Coronavirinae; Betacoronavirus; Severe acute respiratory syndrome-related coronavirus
Cравнение аннотаций из GenBank и RAST
В GenBank 13, RAST выдал 11
- Полностью совпали 5 генов
- Одинаковые старты, разные стопы - 1
- Число генов с одинаковым стоп-кодоном, но разными старт-кодонами - 5
Число генов, аннотированных GenBank, и не аннотированных RAST - 2
- Для проверки несовпадающих аннотаций в BLAST были выбраны 3 гена (blastp):
sars8b:
Аннотация GenBank подходит, предсказание RAST - нет (короткая последовательность)
sars3a:
Аннотация GenBank подходит, предсказание RAST - нет (короткая последовательность)
sars6:
И снова. Аннотация GenBank подходит, предсказание RAST - нет (короткая последовательность)
В моем случае, аннотации GenBank более правдоподобны, но, для машины, RAST справляется довольно неплохо - находит большинство белков, хоть и с ошибками.