• Главная
  • Обо мне
  • Семестры
    Семестр 1
    Семестр 2
    Семестр 3
    Семестр 4
    Семестр 5
    Семестр 6
  • Проекты
  • Заметки
  • Ссылки
Паттерны и банк PROSITE Отредактировано 12/05/13
Семестр 1
Семестр 2
Семестр 3
Семестр 4
Семестр 5
Семестр 6

Содержит ли Swissprot послание инопланетян…


Для определения используем слово, состоящее литер, обозначающих аминокислоты:


DEATH


[D] – Asp (аспарагиновая кислота);

[E] – Glu (глутаминовая кислота);

[A] – Ala (аланин);

[T] – Thr (треонин);

[H] – His (гистидин).


Рассчитаем теоретическую вероятность встречаемости рассматриваемого слова в Swissprot:


191670831×D×E×T×H=191670831×5,45×6,75×8,25×5,34×2,27×10-10=70,5


где 191670831 – количество всех аминокислотных остатков, из которых могут быть составлены последовательности банка данных, а однобуквенные названия аминокислот обозначают их встречаемость в Swissprot.

Экспериментально число встреч слова в банке можно определить с помощью сервиса PROSITE. Слово будет искаться как паттерн – запись, которая отражает, какие аминокислоты должны быть в белковой последовательности. Созданы такие записи на основе множественного выравнивания уже найденных гомологов.

Итог поиска: мотив найден в 69 последовательностях.

Поиск показал, что экспериментальная вероятность встречаемости паттерна меньше, чем теоретическая. Это следствие расположения аминокислот в паттерне. Сначала идут две заряженные (кислые) аминокислоты, затем аминокислота с алифатическим радикалом, далее расположена нейтральная аминокислота, и замыкает паттерн заряженная (основная) аминокислота. Вероятность нахождения такого сочетания в природе меньше, чем рассчитанная теоретическая вероятность.


Нахождение вероятных гомологов белка TENI_BACSU в банке Swissprot с помощью паттернов


Паттерны можно условно разделить на «сильные» и «слабые». Деление основано на том, какое количество последовательностей будет найдено и какова их гомологичность.

«Сильный» паттерн содержит много условий поиска. Он будет находить гомологические последовательности с большей долей уверенности. При этом некоторые из гомологов.

«Слабый» паттерн содержит мало условий поиска. Соответственно, он будет находить много последовательностей, но с меньшей уверенностью в гомологи.

Таблица 1

Поиск гомологов в банке SwissProt с помощью паттернов


Характеристика паттерна Паттерн В скольких последовательностях банка Swissprot найден мотив, удовлетворяющий паттерну? Все ли последовательности выравнивания найдены?
Сильные [MYL]-x(5)-[LVT]-[HY]-[ALV]-[IV]-[TVI]-x(2)-[D>] 69 5
Слабые [GR]-[VI]-H-[LVI]-[GARP]-x(4)-[PDRS]-x(3)-[AIV]-R-x(1)-[ILRQ] 101 Все


Таблица 2

Поиск мотивов PROSITE в последовательности белка TENI_BACSU


Идентифи-катор документа Prosite (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (если это паттерн) Специ-фична ли подпись Сколько мотивов нашлось в белке?
PS00006 CK2_PHOSPHO_SITE Casein kinase II phosphorylation site паттерн [ST]-x(2)-[DE] нет 3
PS00005 PKC_PHOSPHO_SITE Protein kinase C phosphorylation site паттерн [ST]-x-[RK] нет 2
PS00008 MYRISTYL N-myristoylation site паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} нет 1
PS00004 CAMP_PHOSPHO_SITE cAMP- and cGMP-dependent protein kinase phosphorylation site паттерн [RK](2)-x-[ST] нет 1
PS00007 TYR_PHOSPHO_SITE Tyrosine kinase phosphorylation site паттерн [RK]-x(2)-[DE]-x(3)-Yor[RK]-x(3)-[DE]-x(2)-Y нет 1


© Малеева Александра