Для дальнейшего исследования был выбран фрагмент множественного выравнивания длиной 20 а.о., полученного на прошлом занятии: fragment.html Выбранный фрагмент, не содержащий гэпов, был экспортирован в формате FASTA в текстовой файл part2.txt. Были созданы 3 паттерна, проведён поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов. В результате поиска были получены следующие данные:
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности | D-S-V-S-R-F-I-P-G-V-L-G-H-E-A-S-A-T-E-D | 14 | Нет, найдена лишь последовательность TRMD_ECOLI |
Сильный | D-[SGA]-[IVL]-[IASTV]-R-[RLFQ]-[LI]-P-[DNEG]-[AIVS]-[ML]- [SGN]-[DNAH]-[EDKAV]-[QKEADG]-S-[HAV]-[IEVQT]-[QE] |
60 | Да |
Слабый | D-x(3)-R-x-[LI]-P-x(2)-[ML]-x(4)-S-x(2)-[QE]-D | 124 | Да |
Идентификатор документа PROSITE (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (регулярное выражение) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS00005 | PKC_PHOSPHO_SITE | Сайт фосфорилирования протеин киназы C | паттерн | [ST] - x - [RK] (S or T is the phosphorylation site) |
неспецифична | 2 |
PS00006 | CK2_PHOSPHO_SITE | Сайт фосфорилирования казеин киназы II | паттерн | [ST] - x(2) - [DE] (S or T is the phosphorylation site) |
неспецифична | 9 |
PS00007 | TYR_PHOSPHO_SITE | Сайт фосфорилирования тирозин киназы | паттерн | [RK] - x(2) - [DE] - x(3) - Y or [RK] - x(3) - [DE] - x(2) - Y (Y is the phosphorylation site) |
неспецифична | 1 |
PS00008 | MYRISTYL | Сайт N-миристоилирования | паттерн |
G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} (G is the N - myristoylation site) |
неспецифична | 1 |
PS00009 | AMIDATION | Сайт амидирования | паттерн | x - G - [RK] - [RK] (x is the amidation site) |
неспецифична | 1 |
C помощью программы prophecy на основе файла part2.txt была построена матрица PSSM, сохранённая в файле part2.prophecy В результате использования программы profit был получен файл part2.profit При просмотре содержимого полученных файлов было установлено, что программа prophecy строит матрицу частот аминокислотных остатков, а программа profit выдаёт вес последовательностей по полученной матрице PSSM. Наибольший вес имеет последовательность TRMD_PSEA7 (95%).