Содержит ли Swissprot послание инопланетян?
Слово
angry фактически встречается у 64 находок среди последовательностей белков банка Swissprot,
тогда как теоретически этих находок должно быть около 73. Теоретическая встречаемость рассчитывалась с помощью использования данных
о встречаемости конкретных аминокислот и объема банка Swissprot. Таким образом, мы можем утверждать, что слово
angry не несет никакой функциональной нагрузки, не имеет смысла на языке белков.
Поиск гомологов с помощью сильных и слабых паттернов
В данной части практикума создавался "сильный" (т.е. паттерн с более сильными и жесткими условиями поиска) и "слабый" (содержащий более мягкие условия поиска)
паттерны для поиска гомологов белка. Результаты представлены в таблице 1.
Табл. 1. Паттерны и результат их действия |
Характеристика паттерна |
Паттерн |
В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? |
Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько) |
Очень сильный |
{P-S-x(1)-I-R-V-E-A-D-E-L-T-Y-x(1,2)-H |
1 |
Найден только исконный белок |
Сильный |
D-x(1,2)-G-[VC]-L-Q-x(0,3)-D-x(1)-HW-x(1,2)-G-x(1,3)-[YSG]-x(1)-[PA]-x(1)-Y-x(1,2)-G |
615 |
все |
Слабый |
H-E-x(1,2)-H-x(1,2)-Y-E-Q |
1415 |
все |
Слабый паттерн были выбран нарочно "с запасом" - в него был включен мотив, обязательный для семейства белков M32, к которому принадлежит и белок
YPWA_BACSU. Так как количество находок было очень большим, то вручную сложно проверять все ли последовательности выравнивания были найдены, поэтому я предполагаю, что
все именно в силу слабости паттерна и обязательности его присутствия. Если же найдется такой гомолог, который не был найден
с помощью этого паттерна, могу предполагать только то, что это зависит от использования в PROSITE только БД Swiss-Prot. Ведь при поиске гомологов с помощью Blast использовался RefSeq.
Табл. 2. Мотивы в последовательности YOWA_BACSU |
Идентификатор документа Prosite (AC) |
Название мотива |
Краткое описание мотива |
Тип подписи (паттерн, профиль) |
Паттерн (если это паттерн) |
Специфична ли подпись? |
Сколько мотивов нашлось в белке? |
PS00004 |
CAMP_PHOSPHO_SITE |
сайт цAMФ- и цГMФ-зависимых белков-киназ фосфорилирования |
паттерн |
[RK](2)-x-[ST] |
неспецифична |
1 |
PS00008 |
MYRISTYL |
сайт N-миристилирования |
паттерн |
G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} |
неспецифична |
6 |
PS00001 |
ASN_GLYCOSYLATION |
сайт N-гликозилирования |
паттерн |
N-{P}-[ST]-{P} |
неспецифична |
3 |
PS00005 |
PKC_PHOSPHO_SITE |
Сайт фосфорилирования протеинкиназы С |
паттерн |
[ST]-x-[RK] |
неспецифична |
6 |
PS00007 |
TYR_PHOSPHO_SITE |
Сайт фосфорилирования тирозинкиназы |
паттерн |
[RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y |
неспецифична |
4 |
PS00006 |
CK2_PHOSPHO_SITE |
Сайт фосфорилирования казеинкиназы II |
паттерн |
[ST]-x(2)-[DE] |
неспецифична |
8 |
PS00016 |
RGD |
последовательность прикрепления клеток |
паттерн |
RGD |
неспецифична |
1 |
PS00009 |
AMIDATION |
сайт амидирования |
паттерн |
x-G-[RK]-[RK] |
неспецифична |
1 |