Паттерны и банк PROSITE
Отредактировано 12/05/13
Содержит ли Swissprot послание инопланетян… Для определения используем слово, состоящее литер, обозначающих аминокислоты:
[D] – Asp (аспарагиновая кислота);
[E] – Glu (глутаминовая кислота);
[A] – Ala (аланин);
[T] – Thr (треонин);
[H] – His (гистидин).
Рассчитаем теоретическую вероятность встречаемости рассматриваемого слова в Swissprot:
где 191670831 – количество всех аминокислотных остатков, из которых могут быть составлены последовательности банка данных, а однобуквенные названия аминокислот обозначают их встречаемость в Swissprot. Экспериментально число встреч слова в банке можно определить с помощью сервиса PROSITE. Слово будет искаться как паттерн – запись, которая отражает, какие аминокислоты должны быть в белковой последовательности. Созданы такие записи на основе множественного выравнивания уже найденных гомологов. Итог поиска: мотив найден в 69 последовательностях. Поиск показал, что экспериментальная вероятность встречаемости паттерна меньше, чем теоретическая. Это следствие расположения аминокислот в паттерне. Сначала идут две заряженные (кислые) аминокислоты, затем аминокислота с алифатическим радикалом, далее расположена нейтральная аминокислота, и замыкает паттерн заряженная (основная) аминокислота. Вероятность нахождения такого сочетания в природе меньше, чем рассчитанная теоретическая вероятность. Нахождение вероятных гомологов белка TENI_BACSU в банке Swissprot с помощью паттернов Паттерны можно условно разделить на «сильные» и «слабые». Деление основано на том, какое количество последовательностей будет найдено и какова их гомологичность. «Сильный» паттерн содержит много условий поиска. Он будет находить гомологические последовательности с большей долей уверенности. При этом некоторые из гомологов. «Слабый» паттерн содержит мало условий поиска. Соответственно, он будет находить много последовательностей, но с меньшей уверенностью в гомологи. Таблица 1
Таблица 2
|
|||||||||||||||||||||||||||||||||||||||||||||||||||||||
© Малеева Александра
|