Содержит ли Swissprot послание инопланетян?
Рассчитаем теоретическую встречаемость слова chips в базе данных Swissprot. Для этого нам нужно знать встречаемость аминокислот: с-1,37%, h-2,27%, i-5,96%, p-4,7%, s-6,56%. Всего аминокислот в банке Swissprot - 191670831.0,0137*0,0227*0,0596*0,047*0,0656*191670831=10,95 раз ~ 10 раз
На самом деле в банке это слово встречается 6 раз. (проверили с помощью сервиса Prosite)Поиск гомологов белка PLY_BACSU при помощи паттернов
Паттерн - это общая формула функционально важных участков, выявленных на основе множестенного выравнивания последовательностей белка, принадлежащего к хорошо изученному семейству. Паттерны существуют для быстрого получения информации о функциях неизвестного белка.
На основе множественного выравнивания, для белка PLY_BACSU, представленного на рисунке 1, были составленны сильный и слабый паттерны, представленные в таблице 1.
Рис. 1 Участок множественного выравнивания
Последовательности в fasta формате
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько) |
Сильный | R-x-P-x(2)-R-x-G-x(2)-H-x(2)-N-N-x(0,1)-Y | 61 | да,все |
Слабый | N-N-x(0,1)-Y | 11247 | да,все |
Табл.1. Результаты поиска с помощью сервеса Prosite
Мотивы белка PLY_BACSU
Мотивы в аминокислотной последовательности - это определенные консервативные участки, имеющие какую-либо функцию. В таблице 2 представлены мотивы белка PLY_BACSU.
Идентификатор документа Prosite (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (если это паттерн) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS00008 | MYRISTYL | Сайт N-миристоилирования | паттерн | G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} | неспецифична | 19 |
PS00005 | PKC_PHOSPHO_SITE | Сайт фосфорилирования протеин киназы С | сайт | нет | неспецифична | 5 |
PS00009 | AMIDATION | Сайт амидирования | паттерн | x-G-[RK]-[RK] | неспецифична | 2 |
PS00006 | CK2_PHOSPHO_SITE | Сайт фосфорилирования казеин киназы 2 | сайт | нет | неспецифична | 5 |
PS00001 | ASN_GLYCOSYLATION | Сайт N-глюкозирования | паттерн | N-{P}-[ST]-{P} | неспецифична | 4 |
Табл.2. Результаты поиска мотивов белка PLY_BACSU