Занятие 10. Мотивы, паттерны и профилиУпражнение 1. Создать паттерны по множественному выравниванию и провести поиск по паттернам в банке данных Swiss-ProtИмпортируем в Genedoc множественное выравнивание, полученное с помощью muscle.Выберите фрагмент выравнивания длиной 8-20 а.о. для дальнейшего исследования. Выбранный фрагмент Самый длинный участок выбранного фрагмента, не содержащий гэпов в формате FASTA - part2.txt, Рассмотрим выбранный фрагмент множественного выравнивания. Создали 3 паттерна, запишите их в таблицу. В этом упражнении используем три основные элемента синтаксиса паттернов:[ALK] в данной позиции разрешены только остатки в квадратных скобках; Х(3) интервал в 3 любых остатка; {WY} запрет на остатки в фигурных скобках,
Провели поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов. По результатам упражнения заполнили таблицу:
Упражнение 2. Найти и описать все мотивы в белке (по данным БД PROSITE)Найдем в последовательности белка GLPK_ECOLI все мотивы, описанные в PROSITE, в том числе неспецифичные (часто встречающиеся). По результатам поиска составьте следующую таблицу.
Упражнение 3. Создать позиционно-специфичную матрицу частот аминокислотных остатков (PSSM), получить вес последовательности по этой матрицеФайлы с выдачей программ :part2.prophecy - выходной файл программы prophecy part2.profit - выходной файл программы profit Запрос программы "Enter threshold reporting percentage" устанавливает пороговую величину процентного веса последовательности при выводе отчета. Матрица представляет собой таблицу:колонки - аминокислоты в алфавитном порядке, строки - номера позиций в последовательности. В каждой ячейке таблицы указано сколько раз встречается аминокислота (указанная в столбце) в данной позиции (указанной в строке). Запустили программу profit пакета EMBOSS на сервере kodomo-count. В качестве профиля на вход подали файл, полученный с помощью prophecy, а в качестве последовательностей - part2.txt. В результате выполнения программы получили файл "profit.txt", в котором указан вес каждой последовательности в процентах согласно построенной командой prophecy матрицы PSSM. Выводятся последовательности только со сходством более 75% (так как это было указано в запросе программы prophecy "Enter threshold reporting percentage"), но этому условию удовлетворяют все 8 белков. |