На главную страницу

Второй семестр

Описание базы данных СоС


СoC Central: База данных универсально консервативных остатков в белковых складках.
Поисковая база данных консервативных остатков, покрывающая весь спектр известных белковых структур. Знания универсальных консервативных позиций могут помочь в идентификации позиций кинетической и термодинамической важности в укладке белка, а также позиций, имеющих функциональное значение.

Авторы: Hubner, Donald, Shakhnovich, and Mirny

Организация: сведения не обнаружены

Создание базы данных.
База данных СоС составлялась полуавтоматически. Были взяты последовательности семейств белков (из Homology-derived secondary structure of proteins (HSSP)), считающихся гомологичными, далее были составлены выравнивания последовательностей, а также пространственные выравнивания( из FSSP) и выравнивания вторичных структур. Далее по формуле (1)

была вычислена энтропия последовательности s(l). pi(l)- это частота каждой аминокислоты на позиции l множественного выравнивания. Аминокислоты были объединены в шесть классов , что позволило улучшить статистику. Далее были получены структурные выравнивания и был вычислен коэффициент СоС ( s(l))

где l - это позиция структурного выравнивания , а sm - это энтропия семейства m, вычисленная по формуле (1). После подсчета значений СоС была оценена их статистическая значимость. Sexp(l)- это статистический коэффициент СоС, вычисленный для ничего не значащих последовательностей. Выяснилось , что только у 5% позиций вычисленный коэффициент СоС значимо выше, чем статистический. Такие позиции считаются СоС-овыми позициями.

Пользовательские свойства стартовой страницы базы.
На стартовой странице базы СоС дано общее описание базы и ссылки на страницы: поисковая система, описание метода, линки.

Поисковый инструмент базы данных СоС.
База данный обладает собственным поисковым инструментом.
Возможен поиск по идентификатору PDB, по имени или АС записи в базе данных Swiss-Prot, а также по аминокислотной последовательности через BLAST.

Степень заполнения базы.
База данных заполнена белками из FSSP (http://ekhidna.biocenter.helsinki.fi/dali/start )

Пример тестового запроса.
Возможен запрос только по одному полю.

Введём запрос по имени записи в Swiss-Prot ADPP_ECOLI:



Было получено одно совпадение:



Результат: страница с данными по энтропии, СоС числу и консервативности структурного строения:

Оценка базы данных SMART.
База данных СоС предоставляет пользователю возможность, используя идентификатор PDB, имя, АС записи в базе данных Swiss-Prot, или аминокислотную последовательность получить данные по энтропии, СоС числу и консервативности структурного строения вводимого белка. Нельзя не отметить простоту использования поиска, не обремененную лишними записями.

© Таций Ольга, 2006