Мотивы. MEME и MAST.


1. Поиск мотивов программой MEME.
Возьмем файл с последовательностями mypro.fasta, и в командной строке выполняем:
ememetext mypro.fasta memeout.txt temp.fasta -nmotifs 3

Если бы мы взяли лист-файл mypro.list, нужно было бы выполнить команду
ememetext @mypro.list memeout.txt temp.fasta -nmotifs 3
Получаем файл memeout.txt. Таблица по результатам изучения информации из файла:

Номер мотива Во всех ли последовательностях нашелся? Координаты в последовательности YDAF_BACSU P-value в последовательности YDAF_BACSU Длина E-value
1 во всех 5 120-157 1.90e-32 38 1.6e-010
2 во всех 5 91-111 1.12e-20 21 2.0e-006
3 в 2 из 5 (34-54 по RIMJ_SHIFL) - 21 3.9e+000


2. Сравнение блоков (частичных выравниваний), найденных MEME, c полным выравниванием, выданным muscle.
Получаем программой muscle выравнивание. Выполняем команду:
muscle -in mypro.fasta -out mypro_muscle.fasta

Открываем в JalView выравнивание. Выделяем разными цветами участки последовательностей, входящих в найденные программой MEME блоки.
Импортируем картинку.

Сохраняем проект JalView в рабочей директории: mot.jar

Сравним выравнивания MEME и Muscle. Для всех трех мотивов они совпали.

3. Поиск найденных мотивов в других последовательностях.

Командой

degapseq seed.msf seed.fasta

извлекаем последовательности из выравнивания.
Теперь запустим emast:
emast -dfile seed.fasta memeout.txt mastout.html

Получаем выдачу MAST.
1. Всего нашлось 53 последовательности с мотивами из 243, имевшихся в seed.fasta: второй мотив в 29 последовательностях, третий - в одной, первый - нигде.
2. Все мотивы не нашлись ни в одной из последовательностей.
3. Выравнивание Pfam мало где соответствует мотивам.