Содержит ли Swissprot послание инопланетян?

Рассчитаем теоретическую встречаемость слова chips в базе данных Swissprot. Для этого нам нужно знать встречаемость аминокислот: с-1,37%, h-2,27%, i-5,96%, p-4,7%, s-6,56%. Всего аминокислот в банке Swissprot - 191670831.

0,0137*0,0227*0,0596*0,047*0,0656*191670831=10,95 раз ~ 10 раз

На самом деле в банке это слово встречается 6 раз. (проверили с помощью сервиса Prosite)

Поиск гомологов белка PLY_BACSU при помощи паттернов

Паттерн - это общая формула функционально важных участков, выявленных на основе множестенного выравнивания последовательностей белка, принадлежащего к хорошо изученному семейству. Паттерны существуют для быстрого получения информации о функциях неизвестного белка.

На основе множественного выравнивания, для белка PLY_BACSU, представленного на рисунке 1, были составленны сильный и слабый паттерны, представленные в таблице 1.

Рис. 1 Участок множественного выравнивания

Последовательности в fasta формате


Характеристика паттернаПаттернВ скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну?Все ли последовательности из вашего выравнивания найдены? (если нет, то сколько)
СильныйR-x-P-x(2)-R-x-G-x(2)-H-x(2)-N-N-x(0,1)-Y61да,все
СлабыйN-N-x(0,1)-Y11247да,все

Табл.1. Результаты поиска с помощью сервеса Prosite

Мотивы белка PLY_BACSU

Мотивы в аминокислотной последовательности - это определенные консервативные участки, имеющие какую-либо функцию. В таблице 2 представлены мотивы белка PLY_BACSU.


Идентификатор документа Prosite (AC)Название мотиваКраткое описание мотиваТип подписи (паттерн, профиль)Паттерн (если это паттерн)Специфична ли подпись?Сколько мотивов нашлось в белке?
PS00008MYRISTYLСайт N-миристоилированияпаттернG-{EDRKHPFYW}-x(2)-[STAGCN]-{P}неспецифична19
PS00005PKC_PHOSPHO_SITEСайт фосфорилирования протеин киназы Ссайтнетнеспецифична5
PS00009AMIDATIONСайт амидированияпаттернx-G-[RK]-[RK]неспецифична2
PS00006CK2_PHOSPHO_SITEСайт фосфорилирования казеин киназы 2сайтнетнеспецифична5
PS00001ASN_GLYCOSYLATIONСайт N-глюкозированияпаттернN-{P}-[ST]-{P}неспецифична4

Табл.2. Результаты поиска мотивов белка PLY_BACSU