Мотивы, паттерны и профили

Создание паттернов аминокислотных последовательностей

Для построения паттернов был выбран фрагмент выравнивания из 13 аминокислотных остатков.

Создание паттернов по множественному выравниванию и поиск по паттернам в банке данных Swiss-Prot:
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности G-A-N-K-V-A-V-I-K-A-V-R-G 38 Нет, найдена только последовательность моего белка
Сильный [GS]-[AKNGE]-[NKE]-[KR]-[IV]-[NKAP]-V-I-K-[TAVM]-[VA]-R-[SEG] 88 да
Слабый X(2)-{AFGLMVP}-[KR]-[IV]-X-V-I-K-X-[VA]-R-[SEG] 241 да

В слабом паттерне можно было и исключить вначале первые две позиции (X(2)), они приведены, в общем, лишь для того, чтобы показать владение синтаксисом паттернов. Что интересно, в первой позиции у всех выбранных последовательностей, кроме RK12_EUGGR стоит глицин, но я ослабила паттерн, заменив на Х. Но на выходе PROSITE нашёл 241 последовательность, у 240 из которых на первом месте стоит именно глицин, и лишь одну последовательность с серином - RK12_EUGGR.
Наиболее предпочтительным оказался поиск по сильному паттерну, поскольку последовательность достаточно консервативна, поиск доказал, что все последовательности можно обнаружить и по сильному паттерну, при этом, в сравнении со слабым, количество выборки меньше почти в 3 раза.

Все описанные в PROSITE мотивы в заданном белке RL7_Ecoli

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00008 MYRISTYL Сайт N-миристоилирования паттерн G-{EDRKHPFYW}-x(2)-[STAGCN]-{P} неспецифична 2
PS00006 CK2_PHOSPHO_SITE Сайт фосфорилирования казеинкиназы II паттерн [ST] - x(2) - [DE] неспецифична 4

Построение PSSM и определение веса последовательности по полученной матрице

Программа prophecy пакета EMBOSS строит матрицу частот аминокислотных остатков для данной группы последовательностей. По вертикали идёт номер в цепи, а по горизонтали - аминокислотные остатки в алфавитном порядке. Полученная матрица выглядит так.
Запрос программы "Enter threshold reporting percentage" просит задать пороговое значение для веса.
Программа profit пакета EMBOSS определяет вес каждой последовательности (в процентах), согласно заданной матрице.

Назад

На главную


©Степанова Вита