Описание базы данных СоС
СoC Central: База данных универсально консервативных остатков в белковых
складках.
Поисковая база данных консервативных остатков, покрывающая весь спектр
известных белковых структур. Знания универсальных консервативных позиций
могут помочь в идентификации позиций кинетической и термодинамической важности
в укладке белка, а также позиций, имеющих функциональное значение.
Авторы: Hubner, Donald, Shakhnovich, and Mirny
Организация: сведения не обнаружены
Создание базы данных.
База данных СоС составлялась полуавтоматически. Были взяты
последовательности семейств белков (из Homology-derived secondary structure
of proteins (HSSP)),
считающихся гомологичными, далее были составлены выравнивания
последовательностей, а также пространственные выравнивания( из FSSP) и
выравнивания вторичных структур. Далее по формуле (1)
была вычислена энтропия последовательности s(l). pi(l)- это частота каждой
аминокислоты на позиции l множественного выравнивания. Аминокислоты были
объединены в шесть классов , что позволило улучшить статистику. Далее были
получены структурные выравнивания и был вычислен коэффициент СоС ( s(l))
где l - это позиция структурного выравнивания , а sm - это энтропия
семейства m, вычисленная по формуле (1). После подсчета значений СоС была
оценена их статистическая значимость. Sexp(l)- это статистический
коэффициент СоС, вычисленный для ничего не значащих последовательностей.
Выяснилось , что только у 5% позиций вычисленный коэффициент СоС значимо выше,
чем статистический.
Такие позиции считаются СоС-овыми позициями.
Пользовательские свойства стартовой страницы базы.
На стартовой странице базы СоС дано общее описание базы и ссылки на страницы:
поисковая система, описание метода, линки.
Поисковый инструмент базы данных СоС.
База данный обладает собственным поисковым инструментом.
Возможен поиск по
идентификатору PDB, по имени или АС записи в базе данных Swiss-Prot, а также
по аминокислотной последовательности через BLAST.
Степень заполнения базы.
База данных заполнена белками из FSSP
(http://ekhidna.biocenter.helsinki.fi/dali/start )
Пример тестового запроса.
Возможен запрос только по одному полю.
Введём запрос по имени записи в Swiss-Prot ADPP_ECOLI:
Было получено одно совпадение:
Результат:
страница с данными по энтропии, СоС числу и консервативности
структурного строения:
Оценка базы данных SMART.
База данных СоС предоставляет пользователю возможность, используя
идентификатор PDB, имя, АС записи в базе данных Swiss-Prot, или
аминокислотную последовательность получить данные по энтропии,
СоС числу и консервативности структурного строения вводимого белка.
Нельзя не отметить простоту использования поиска, не обремененную лишними
записями.
©
Шпильман Алексей, 2006