В предыдущем задании было получено выравнивание и его изображение. Из выравнивания был выбран наиболее консервативный фрагментик:
![]()
Создадим следующие паттерны:
1. Первый паттерн - фрагмент последовательности исследуемого белка.
I-R-N-T-C-T-Y-C-S-V-G-C-G-L-L-M-Y-S
2. Второй ("сильный") паттерн должен распознавать все белки выборки:
[TISVY]-[TRQK]-[STN]-[VTLS]-C-[CTPAR]-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-[ILESMD]-[VMLA]-[HYVSAW]-[TSA]
3. Третий ("слабый") паттерн на основе второго:
C-X-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-X-[VMLA]
Проделаны следующие манипуляции с "сильными" паттерном:
- заменены позиции, где было 5 разных остатков на Х.
- удалено 2 позиции с правого конца и 4 слевого.
Таблица 1. Сравнение паттернов.
Характеристика паттерна Паттерн В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? Все ли последовательности из Вашего выравнивания найдены? Фрагмент последовательности I-R-N-T-C-T-Y-C-S-V-G-C-G-L-L-M-Y-S 1 Нет, найден только исследуемый белок. Сильный [TISVY]-[TRQK]-[STN]-[VTLS]-C-[CTPAR]-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-[ILESMD]-[VMLA]-[HYVSAW]-[TSA] 20 Да Слабый X(4)-C-X-[YF]-C-[SAG]-V-[GS]-C-[GS]-[LMVF]-X-[VMLA] 28 Да В выдаче при поиске "слабого" паттерна были следующие белки:
sp|Q934F5|FDHA_DESGI
sp|P06131|FDHA_METFO
sp|P61159|FDHA_METJA
sp|Q795Y4|FDHL_BACSU
sp|Q2FEI5|FDHL_STAA3
sp|Q2FVV9|FDHL_STAA8
sp|Q2YYT1|FDHL_STAAB
sp|Q5HDP9|FDHL_STAAC
sp|Q931G2|FDHL_STAAM
sp|Q99RW4|FDHL_STAAN
sp|Q6GEC4|FDHL_STAAR
sp|Q6G711|FDHL_STAAS
sp|Q7A057|FDHL_STAAW
sp|Q4L8G8|FDHL_STAHJ
sp|Q49ZN0|FDHL_STAS1
sp|P24183|FDNG_ECOLI
sp|P32176|FDOG_ECOLI
sp|P46448|FDXG_HAEIN
sp|Q6D5Z2|NAPA_ERWCT
sp|C6DK59|NAPA_PECCP
sp|B0TSW5|NAPA_SHEHH
sp|Q8EIJ1|NAPA_SHEON
sp|Q67QZ1|NAPA_SYMTH
sp|O33732|NARB_SHEFN
sp|P39458|NARB_SYNE7
sp|P73448|NARB_SYNY3
sp|Q06457|NASA_KLEOX
sp|O34720|YJGC_BACSU.Видно, что большая часть это формиат дегидрогеназы, как и изучаемый белок. Остальные нитрат редуктазы и ещё один дальний гомолог формиат дегидрогеназы.
Таблица 2. Результаты поиска мотивов в заданном белке.
Идентификатор документа PROSITE (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (регулярное выражение) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS51318 | TAT |
Сайт транслокации спаренных аргининов | профиль | - |
неспецифична | 1 |
PS00551 | MOLYBDOPTERIN_PROK_1 | Сайт прокариотической молибдоптериновой оксидоредуктазы | паттерн | [STAN]-x-[CH]-x(2,3)-C-[STAG]-[GSTVMF]-x-C-x-[LIVMFYW]-x-[LIVMA]-x(3,4)-[DENQKHT] | специфична | 1 |
PS00932 | MOLYBDOPTERIN_PROK_1 | Сайт прокариотической молибдоптериновой оксидоредуктазы | паттерн | A-x(3)-[GDTN]-[IF]-x-[DNQTKEH]-x-[DEAQ]-x-[LIVM]-x-[LIVMC]-x-[NS]-x(2)-[GS]-x(4,5)-[AV]-x-[LIVMEF]-[STY] | специфична | 1 |