Содержит ли SwissProt послание инопланетян?



Для вычисления теоретической встречаемости слова ANKLE в последовательностях белков базы данных SwissProt необходимо перемножить доли всех букв слова (в %), число всех букв и 10^(-10). Доли аминокислот таковы:

A	8,25
N	4,06
K	5,84
L	9,66
E	6,75
Число всех букв 191670831. Таким образом получется, что слово ankle должно встретиться 244 раза, однако на самом деле оно встречается только 132 (по данным сервиса Prosite). Это может быть связано с тем, что база данных не бесконечна, размещение аминокислот впоследовательностях не случайно, а инопланетян не существует.

Поиск гомологов белка PDXT_BACSU c помощью паттернов и ScanProsite



На основе множественного выравнивания были созданы два паттерна:"сильный" и "слабый", и осуществлен поиск гомологов с помощью ScanProsite. Результаты приведены в таблице ниже.
Характеристика паттерна Паттерн Количество найденных последовательностей Количество последовательностей из ранее проделанного выравнивания
Сильный [LI]-x(3)-F-H-P-E-L-x(2,3)-D-x(3)-H 111 не все(30/33)
Слабый [LIMF]-x(4)-H-P-E-[LVE]-x(2,3)-D 329 все

Поиск всех мотивов PROSITE в последовательности белка PDXT_BACSU



С помощью веб-интерфейса ScanProsite был произведен поиск мотивов, результаты представлены в таблице ниже.
Идентификатор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн Специфичность Количество мотивов в белке
PS51130 PDXT_SNO_2 PdxT/SNO family profile Профиль нет Специфична 1
PS01236 PDXT_SNO_1 PdxT/SNO family family signature Паттерн [GARVS]-[LVI]-[ILAV]-[LIVF]-P-G-G-E-S-[TS]-[STAV] Специфична 1