Учебный сайт Кирилла Цуканова → Второй семестр

Поиск мотивов, программы MEME и MAST

Упражнение 1: поиск мотивов с MEME

Возьмем список белков из занятия по множественным выравниваниям и запустим ememetext. Нашлось три мотива:

Длина мотиваE-valueГде нашелсяПоложение в YVDD_BACSUP-value
1501.8e-1116/687—1368.66e-53
2501.1e-0566/62—511.69e-44
3454.7e-0225/6 (кроме FAS6_RHOFA)137—1812.30e-38

Стоит привести блоковое представление всех последовательностей:

SEQUENCE NAME            COMBINED P-VALUE  MOTIF DIAGRAM
-------------            ----------------  -------------
YVDD_BACSU                      4.31e-123  1_[2(1.69e-44)]_35_[1(8.66e-53)]_[3(2.30e-38)]_10
Y4923_PSEAE                     2.26e-124  3_[2(1.07e-46)]_35_[1(2.87e-52)]_[3(5.21e-38)]_12
LOG_ORYSJ                       5.05e-133  35_[2(2.30e-48)]_35_[1(6.07e-55)]_[3(9.83e-43)]_27
LOG1_ARATH                      3.43e-133  7_[2(6.51e-49)]_35_[1(6.07e-55)]_[3(3.81e-42)]_26
FAS6_RHOFA                       1.41e-85  19_[2(1.97e-42)]_36_[1(1.54e-52)]_43
YJF5_YEAST                      4.55e-127  18_[2(1.18e-44)]_61_[1(1.94e-53)]_[3(5.62e-42)]_21

Упражнение 2: MEME vs. muscle

Возьмем файл tmp.fasta, выданный MEME, выровняем его с помощью muscle, откроем в Jalview и разметим мотивы, найденные MEME. Результат:

Раскрашены по Clustalx и выделены в рамку три мотива: MEME2, MEME1, MEME3. Видно, что из-за того, что цепь FAS6_RHOFA кончается рано, мотив 3 в ней MEME не нашел, хотя он там явно есть, хоть и не целиком. Наверное, если бы ограничение на количество мотивов было больше 3, то появился бы и небольшой четвертый примерно на позициях 93—110.

Упражнение 3: поиск мотивов в других последовательностях

Seed-выравнивание возьмем из прошлого занятия, с помощью degapseq получим seed.fasta.

Результат работы emast. Как видно, мотив 1 нашелся во всех 32 последовательностях из seed-выборки. Но только он, участки, несущие мотивы 2 и 3, просто не представлены в выборке в достаточной части. Еще раз приведем seed-выравнивание, область найденного мотива выделена окрашиванием по Clustalx:

(Область выбрана по YVDD_BACSU, в других последовательностях начало и конец мотива могут несколько отличаться.) Выравнивание в целом соответствует мотиву, хотя заметны и отдельные пропуски и несоответствия.

Дополнительно: сервис MEME Suite

Засабмиттим те же шесть последовательностей, просто чтобы получить впечатление о сервисе. Довольно быстро пришло письмо с результатами. На выходе — шикарная html-страница с результатами. (Не нашел информации, сколько хранится результат, на всякий случай зеркало.)

Особенно порадовала визуальная часть и интерактивные няшности: