На главную
Второй семестр


Создание паттернов аминокислотных последовательностей

Выбранный участок

Паттерны

Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены?
Фрагмент последовательности  IVGIDAVVLSTQH  46  найдена только одна
Сильный  [PIVA]-[VKQ]-[RGF]-[VI]-[DH]-[TA]-[IV]-[VL]-[IL]-STQH  174  все
Слабый  x{GP}-x-[VI]-[DH]-[TA]-[IV]-[VL]-[IL]-ST  291  все
При создании "слабого" паттерна убрала [PIVA] с одного конца и QH - с другого. Вместо [VKQ] ипользовала x{GP}: G и P не обладают ни гидрофобностью, ни полярностью, ни положительным зарядом. Так как RGF не связаны ни одним из свойств аминокислот(R полярна, F гидрофобна, а G не обладает ни одним из этих свойств), то заменила [RGF] на x.

Все описанные в PROSITE мотивы в заданном белке METK_ECOLI

Идентификатор документа PROSITE (AC) Название мотива Краткое описание мотива Тип подписи (паттерн, профиль) Паттерн (регулярное выражение) Специфична ли подпись? Сколько мотивов нашлось в белке?
PS00376 ADOMET_SYNTHETASE_1 S-аденозилметионин синтетаза подпись 1 паттерн [GN] - [AS] - G - D - Q - G - x(3) - G - [FYHG] специфична 1
  PS00377  ADOMET_SYNTHETASE_2  S-аденозилметионин синтетаза подпись 2  паттерн  G - [GA] - G - [ASC] - [FY] - S - x - K - [DE]/td>  специфична  1
 PS00006  CK2_PHOSPHO_SITE  Сайт фосфорилирования казеинкиназой II  паттерн  [ST] - x(2) - [DE] [S or T is the phosphorylation site]  неспецифична  5
 PS00008  MYRISTYL  Сайт N-миристоилирования  паттерн  G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} [G is the N - myristoylation site]  неспецифична  6
 PS00005  PKC_PHOSPHO_SITE  Сайт фосфорилирования протеинкиназы  паттерн  [ST] - x - [RK]  неспецифична  6
 PS00001  ASN_GLYCOSYLATION  Сайт N-гликозилирования  паттерн  N - {P} - [ST] - {P}  неспецифична  2
 PS00009  AMIDATIO  Сайт амидитирования  паттерн   x - G - [RK] - [RK]  неспецифична  1
 PS00007  TYR_PHOSPHO_SITE  Сайт фосфорилирования тирозинкиназы  паттерн   [RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y>  неспецифична  1

Построение PSSM и определение веса последовательности по полученной матрице

Построила PSSM с помощью программы prophecy пакета EMBOSS на сервере kodomo-count, которая создает матрицу по заданному множественному выравниванию.
На вход подала файл с выравниванием фрагмента part2.txt, созданный при выполнении упр.1.
Проверила, что по умолчанию выбран тип профиля 'F' (Frequency), а не G (Gribscov) или H (Henikoff). В связи с выбранным режимом был использован EMBLOSUM62 (штраф за открытие гэпа 3.0, за продление - 0.3), который так же соответсвует и режиму H. В случае G мы имели бы дело с Epprofile.
Запустила программу profit пакета EMBOSS на сервере kodomo-count, которая используя матрицу, определяет вес последовательности. В качестве профиля на вход подала файл part2.prophecy, полученный с помощью prophecy, а в качестве последовательностей - part2.txt.
Порядок работы порграммы profit следующий: 1) для каждой в отдельности последовательности в списке поиска происходит высчитывание веса выравнивания на основе программы prophecy, 2) идет процедура сопоставления полученного значения с пороговым процентом от максимально возможного счета для данной матрицы (задавалось командой threshold reporting percentage), 3) в случае, когда вес оказывается выше порогового, программа выдает соответствующее сообщение.
Я же в результате действия программы profit получила выходной файл part2.profit
©Третьякова Светлана, 2007