Содержит ли Swissprot послание инопланетян?
Слово angry фактически встречается у 64 находок среди последовательностей белков банка Swissprot, тогда как теоретически этих находок должно быть около 73. Теоретическая встречаемость рассчитывалась с помощью использования данных о встречаемости конкретных аминокислот и объема банка Swissprot. Таким образом, мы можем утверждать, что слово angry не несет никакой функциональной нагрузки, не имеет смысла на языке белков.Поиск гомологов с помощью сильных и слабых паттернов
В данной части практикума создавался "сильный" (т.е. паттерн с более сильными и жесткими условиями поиска) и "слабый" (содержащий более мягкие условия поиска) паттерны для поиска гомологов белка. Результаты представлены в таблице 1.| Табл. 1. Паттерны и результат их действия | |||||||||||||||
| Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько) |
| Очень сильный | {P-S-x(1)-I-R-V-E-A-D-E-L-T-Y-x(1,2)-H | 1 | Найден только исконный белок |
| Сильный | D-x(1,2)-G-[VC]-L-Q-x(0,3)-D-x(1)-HW-x(1,2)-G-x(1,3)-[YSG]-x(1)-[PA]-x(1)-Y-x(1,2)-G | 615 | все |
| Слабый | H-E-x(1,2)-H-x(1,2)-Y-E-Q | 1415 | все |
Слабый паттерн были выбран нарочно "с запасом" - в него был включен мотив, обязательный для семейства белков M32, к которому принадлежит и белок YPWA_BACSU. Так как количество находок было очень большим, то вручную сложно проверять все ли последовательности выравнивания были найдены, поэтому я предполагаю, что все именно в силу слабости паттерна и обязательности его присутствия. Если же найдется такой гомолог, который не был найден с помощью этого паттерна, могу предполагать только то, что это зависит от использования в PROSITE только БД Swiss-Prot. Ведь при поиске гомологов с помощью Blast использовался RefSeq.
| Табл. 2. Мотивы в последовательности YOWA_BACSU | ||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||||
| Идентификатор документа Prosite (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (если это паттерн) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
| PS00004 | CAMP_PHOSPHO_SITE | сайт цAMФ- и цГMФ-зависимых белков-киназ фосфорилирования | паттерн | [RK](2)-x-[ST] | неспецифична | 1 |
| PS00008 | MYRISTYL | сайт N-миристилирования | паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} | неспецифична | 6 |
| PS00001 | ASN_GLYCOSYLATION | сайт N-гликозилирования | паттерн | N-{P}-[ST]-{P} | неспецифична | 3 | PS00005 | PKC_PHOSPHO_SITE | Сайт фосфорилирования протеинкиназы С | паттерн | [ST]-x-[RK] | неспецифична | 6 | PS00007 | TYR_PHOSPHO_SITE | Сайт фосфорилирования тирозинкиназы | паттерн | [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y | неспецифична | 4 | PS00006 | CK2_PHOSPHO_SITE | Сайт фосфорилирования казеинкиназы II | паттерн | [ST]-x(2)-[DE] | неспецифична | 8 | PS00016 | RGD | последовательность прикрепления клеток | паттерн | RGD | неспецифична | 1 | PS00009 | AMIDATION | сайт амидирования | паттерн | x-G-[RK]-[RK] | неспецифична | 1 |