Практикум


Задание 1

Для аннотации была выбрана единственная кольцевая хромосома бактерии Escherichia coli UMN026.
Таксономия организма
BacteriaBacteria
Regio:
Regnum:
Phylum:Proteobacteria
Classis:Gamma Proteobacteria
OrdoEnterobacteriales
FamiliaEnterobacteriaceae
Genus:Escherichia
Species:Escherichia coli
Strain:Escherichia coli O157:H7 str. Sakai
При помощи Rast была проведена аннотация, а также диаграмму функциональных групп.
Таблица анотаций в rast, табица анотаций в NCBI
RAST аннотировал 5595 генов белков
GenBank аннотировал 5204.
Число совпадающих аннотаций: 4133.
Число генов, расположенных на обратной цепи, у которых не совпадают старт-кодоны, а стоп-кодоны совпадают: 402
Число генов, расположенных на прямой цепи, у которых не совпадают старт-кодоны, а стоп-кодоны совпадают: 426
Число генов, аннотированных GenBank, но не RAST: 409
Число генов, аннотированные RAST, но не GenBank: 796
Был еще рассмотрен белок transcriptional regulator, расположенный на обратной цепи.
Было найдено также нескролько находок как для genbank, так и для rast, лучшие из которых принадлежала Escherichia coli
Как видно из приведенного рисунка ниже, в данном случае rast (справа) справился лучше genbank (слева) (как видно на рисунке rast совпал старт кодон).
Также белок genbank обладает большей длинной, чем в rast (на 6 кодонов). Если вычесть эти самые 6 аминокислот, то расположение стоп-кодонов, что в rast, что в genbank будет одинаково.

© Полина Николаева 2014.
genome assemblies: 2 contiga AANG03 task2 id 386585