Упражнение 1: поиск мотивов с MEME
Возьмем список белков из занятия по множественным выравниваниям и запустим ememetext
. Нашлось три мотива:
Длина мотива | E-value | Где нашелся | Положение в YVDD_BACSU | P-value | |
1 | 50 | 1.8e-111 | 6/6 | 87—136 | 8.66e-53 |
2 | 50 | 1.1e-056 | 6/6 | 2—51 | 1.69e-44 |
3 | 45 | 4.7e-022 | 5/6 (кроме FAS6_RHOFA) | 137—181 | 2.30e-38 |
Стоит привести блоковое представление всех последовательностей:
SEQUENCE NAME COMBINED P-VALUE MOTIF DIAGRAM ------------- ---------------- ------------- YVDD_BACSU 4.31e-123 1_[2(1.69e-44)]_35_[1(8.66e-53)]_[3(2.30e-38)]_10 Y4923_PSEAE 2.26e-124 3_[2(1.07e-46)]_35_[1(2.87e-52)]_[3(5.21e-38)]_12 LOG_ORYSJ 5.05e-133 35_[2(2.30e-48)]_35_[1(6.07e-55)]_[3(9.83e-43)]_27 LOG1_ARATH 3.43e-133 7_[2(6.51e-49)]_35_[1(6.07e-55)]_[3(3.81e-42)]_26 FAS6_RHOFA 1.41e-85 19_[2(1.97e-42)]_36_[1(1.54e-52)]_43 YJF5_YEAST 4.55e-127 18_[2(1.18e-44)]_61_[1(1.94e-53)]_[3(5.62e-42)]_21
Упражнение 2: MEME vs. muscle
Возьмем файл tmp.fasta, выданный MEME, выровняем его с помощью muscle, откроем в Jalview и разметим мотивы, найденные MEME. Результат:
Раскрашены по Clustalx и выделены в рамку три мотива: MEME2, MEME1, MEME3. Видно, что из-за того, что цепь FAS6_RHOFA кончается рано, мотив 3 в ней MEME не нашел, хотя он там явно есть, хоть и не целиком. Наверное, если бы ограничение на количество мотивов было больше 3, то появился бы и небольшой четвертый примерно на позициях 93—110.
Упражнение 3: поиск мотивов в других последовательностях
Seed-выравнивание возьмем из прошлого занятия, с помощью degapseq
получим seed.fasta.
Результат работы emast
. Как видно, мотив 1 нашелся во всех 32 последовательностях из seed-выборки. Но только он, участки, несущие мотивы 2 и 3, просто не представлены в выборке в достаточной части. Еще раз приведем seed-выравнивание, область найденного мотива выделена окрашиванием по Clustalx:
(Область выбрана по YVDD_BACSU, в других последовательностях начало и конец мотива могут несколько отличаться.) Выравнивание в целом соответствует мотиву, хотя заметны и отдельные пропуски и несоответствия.
Дополнительно: сервис MEME Suite
Засабмиттим те же шесть последовательностей, просто чтобы получить впечатление о сервисе. Довольно быстро пришло письмо с результатами. На выходе — шикарная html-страница с результатами. (Не нашел информации, сколько хранится результат, на всякий случай зеркало.)
Особенно порадовала визуальная часть и интерактивные няшности: