Главная

Поиск мотивов, программы MEME и MAST


Упражнение 1. Поиск мотивов программой MEME

В наборе гомологов моего белка нашла мотивы (до трёх различных мотивов) программой MEME.
1) Создала лист-файл с "адресами" последовательностей и же файл с самими последовательностями (не выравниванием!) в fasta-формате.
2) Запустила на kodomo программу ememetext следующим образом:
ememetext @myproteins.list memeout.txt temp.fasta -nmotifs 3 или
ememetext myproteins.fasta memeout.txt temp.fasta -nmotifs 3
Получила файлы temp.fasta , memeout.txt .
Занесла в таблицу: 1) сколько мотивов найдено; 2) для каждого мотива: во всех ли последовательностях он нашёлся, координаты и P-value в вашей последовательности, характеристики мотива: длину и E-value.
Номер мотива Последовательности, в которых найден мотив Координаты в последовательности DACC_BACSU P-value в последовательности DACC_BACSU Длина E-value
1 Мотив найден в DACC_BACSU, DACB_ECOLI, DACB_HAEIN, DAC_ACTSP
312-153
7.2e-29
27
7.6e-013
2 Мотив найден в DACB_ECOLI, DACB_HAEIN, DACC_BACSU
164-299
3.44e-29
29
1.0e-008
3 Мотив найден в DACB_ECOLI, DACB_HAEIN, DACC_BACSU, DAC_ACTSP
121-330
4.04e-41
41
3.8e-008

2. Сравнение блоков (частичных выравниваний), найденных MEME, c полным выравниванием, выданным muscle

Открыла в JalView выравнивание моих последовательностей, полученное программой muscle.
Выделила участки последовательностей, входящих в найденные программой MEME блоки.
Сохранила проект JalView( motiv.jar ).
Изображение участков выравнивания, включающий блоки.
Получается, первый мотив (последний в изображении) выровнен полностью,а у двух других есть смещения,что можно объяснить более выгодным (по весу) расположением букв в полученном выранивании.

3. Поиск найденных мотивов в других последовательностях


Провела программой MAST поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) одного из доменов(Peptidase_S13) моего белка(DACC_BACSU), взятое из Pfam (PF02113_seed.msf).
1)Извлекла последовательности из выравнивания (то есть убрала знаки пробелов и перевела в fasta-формат) программой degapseq:
degapseq PF02113_seed.msf seed.fasta
2)Запустила программу emast:
emast -dfile seed.fasta memeout.txt mastout.html
Открыла полученный файл ( mastout.html) браузером.
Первый мотив нашелся в 9 последовательностях, второй - в 7, третий - в 7 (из 9, имевшихся в PF02113_seed.fasta).
В 5 последовательностях нашлись все мотивы.
Выравнивание,взятое из Pfam не везде соответствует мотивам (например, 2 мотив (первый в изображении).
©Eliseeva Julia