Предсказание генов прокариот

Главная страница
С помощью сервиса RAST получена следующая информация:таблица с результатами.

Одинаково аннотированных генов 47
Генов с одинаковым стоп-кодоном, но разными старт-кодонами 10
Генов, аннотированных RAST, и не аннотированных в записи GenBank 7
Генов, аннотированных в записи GenBank, и не аннотированных RAST 8

В целом, совпадающих генов примерно 65%, а генов не аннотированных где-либо всего 1%.
Разница в старт-кодонах может быть невелика (3-6), но также может достигать 120 нуклеотидов, причем старт-кодон может выбираться как ближе к началу, так и дальше от него.
В аннотации RAST в конце есть блок, не аннотированный GenBank, возможно, этот кусок генома просто не аннотировался.

Для трех не аннотированных GenBank генов проверена аннотация с помощью BLAST:

Начало Конец RAST BLAST
24009 24206 hypothetical protein hypothetical protein [Escherichia coli]
29285 29118 Phage protein hypothetical protein [Enterobacteriaceae], hypothetical protein HK106_028 [Enterobacteria phage HK106]
34560 35036 Superinfection exclusion protein B Superinfection exclusion protein B [Enterobacteria phage lambda]

Два белка опредилились как гипотетические и скорее принадлежащие бактериям (возможно, эти гены действительно передались бактериям от вирусов и поскольку геном бактерий (а тем белее Escherichia coli) лучше изучен, то в выдачу попали именно они).
Superinfection exclusion protein B подтвержден.

© Широковских Татьяна