Эволюционные домены. Банки Pfam и InterPro.


Доменная архитектура белка PDAA_BACSU в соответствии с банком Pfam

Результаты совпали. Как видно по найденному, слово "light" встречается в самых разных местах последовательностей => его расположение случайно.


Нахождение вероятных гомологов белка PDAA_BACSU в банке SwissProt с помощью паттернов

Создаем слабый и сильный партерны и получаем с помощью них гомологи (табл. 1).

Характеристика паттерна Паттерн Результаты в Swiss-Prot Найдены ли последовательности из множественного выравнивания
Сильный L-T-F-D-[DN]-x-[PY]-x(3,4)-T-x(2)-[ILV]-L-x(2)-L-x(6)-[AG]-[ST]-F-F-x(2)-G-x(16,37)-G-x(2)-[ILV]-[AG]-x-H-x(3)-[DEHY] 12-1=11 0 (есть только сам белок PDAA_BACSU)
Средний G-[CHN]-x-[ILV]-[AG]-[ADLNSTV]-H-[GLMST]-x(2)-[DEHY] 45-1=44 0 (есть только сам белок PDAA_BACSU)
Слабый G-x(2)-[ILV]-[AG]-x-H-x(3)-[DEHY] 3662-1=3661 0 (есть только сам белок PDAA_BACSU)
Таблица 1. Поиск вероятных гомологов белка PDAA_BACSU по различным паттернам.

Использование ни одного паттерна не дало мне найти последовательности гомологов из множественного выравнивания. Почему? Не потому, что у меня плохие гомологи или плохие паттерны, а потому что используемые последовательности находятся в UniProtKB/TrEMBL. Пробуем найти их там: очень долго грузит, видимо, очень много последовательностей даже на сильный паттерн.

Нахождение всех мотивов PROSITE в последовательности белка PDAA_BACSU

Чтобы найти мотивы белка заходим в ScanProsite, там поле слева вводим индефикатор PDAA_BACSU или O34928 и убираем галочку напротив поля "Exclude patterns with a high probability of occurrence" - это нужно для того, чтобы найти все мотивы, а не только те, которые специфичны для этого белка (ведь поле называется "Исключить моделей с высокой вероятностью возникновения"). Находим. Результаты по нахождению вы можете посмотреть в таблице 2, а так же на рисунках 1 и 2 видна организация белка и расположение на нем мотивов соответственно.

Рисунки 1 и 2. Организация белка и расположение на нем мотивов.

Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (если это паттерн) Специфична ли? Сколько мотивов нашлось в белке?
PS00008 MYRISTYL сайт N-миристоилирования (связка белка с мембраной) паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P}[GistheN-myristoylationsite] неспецифична (т.к. "с высокой вероятностью возникновения" - далее все неспецифичные таковы) 1
PS00006 CK2_PHOSPHO_SITE сайт фосфорилирования Casein kinase II паттерн [ST]-x(2)-[DE][SorTisthephosphorylationsite] неспецифична 3
PS00005 PKC_PHOSPHO_SITE сайт фосфорилирования Protein kinase C паттерн [ST]-x-[RK] неспецифична 5
PS00004 CAMP_PHOSPHO_SITE сайт фосфорилирования cAMP- and cGMP-dependent protein kinase паттерн [RK](2)-x-[ST] неспецифична 1
PS00001 ASN_GLYCOSYLATION сайт N-гликозилирования паттерн N-{P}-[ST]-{P} неспецифична 1
PS00009 AMIDATION сайт амидирования паттерн x-G-[RK]-[RK] неспецифична 1
Таблица 2. Мотивы в последовательности PDAA_BACSU.

Источники информации


© Tishina Sofia, 2012