Содержит ли SwissProt послание инопланетян?
Для вычисления теоретической встречаемости слова ANKLE в последовательностях белков базы данных SwissProt необходимо перемножить доли всех букв слова (в %), число всех букв и 10^(-10). Доли аминокислот таковы:
A 8,25 N 4,06 K 5,84 L 9,66 E 6,75Число всех букв 191670831. Таким образом получется, что слово ankle должно встретиться 244 раза, однако на самом деле оно встречается только 132 (по данным сервиса Prosite). Это может быть связано с тем, что база данных не бесконечна, размещение аминокислот впоследовательностях не случайно, а инопланетян не существует.
Поиск гомологов белка PDXT_BACSU c помощью паттернов и ScanProsite
На основе множественного выравнивания были созданы два паттерна:"сильный" и "слабый", и осуществлен поиск гомологов с помощью ScanProsite. Результаты приведены в таблице ниже.
Характеристика паттерна | Паттерн | Количество найденных последовательностей | Количество последовательностей из ранее проделанного выравнивания |
Сильный | [LI]-x(3)-F-H-P-E-L-x(2,3)-D-x(3)-H | 111 | не все(30/33) |
Слабый | [LIMF]-x(4)-H-P-E-[LVE]-x(2,3)-D | 329 | все |
Поиск всех мотивов PROSITE в последовательности белка PDXT_BACSU
С помощью веб-интерфейса ScanProsite был произведен поиск мотивов, результаты представлены в таблице ниже.
Идентификатор документа Prosite (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн | Специфичность | Количество мотивов в белке |
PS51130 | PDXT_SNO_2 | PdxT/SNO family profile | Профиль | нет | Специфична | 1 |
PS01236 | PDXT_SNO_1 | PdxT/SNO family family signature | Паттерн | [GARVS]-[LVI]-[ILAV]-[LIVF]-P-G-G-E-S-[TS]-[STAV] | Специфична | 1 |