Учебный сайт Фоменко Елены

Главная Семестры Проекты Заметки

Мотивы. MEME и MAST.

1. Поиск мотивов программой MEME.

Берем файл с последовательностями myproteins.fasta и через putty выполняем команду в рабочей директории:
ememetext myproteins.fasta memeout.txt temp.fasta -nmotifs 3
Также можно было взять лист-файл myproteins.list и выполнить команду
ememetext @myproteins.list memeout.txt temp.fasta -nmotifs 3 Получаем файл memeout.txt. Составим таблицу по результатам изучения файла:

Номер мотива Во всех ли последовательностях нашелся? Координаты в последовательности YSCD_BACSU P-value в последовательности YSCD_BACSU Длина E-value
1 в 5 из 7 59-104 7.14e-50 46 1.6e-044
2 в 5 из 7 200-249 1.30e-47 50 1.9e-022
3 в 5 из 7 300-335 1.59e-33 36 2.1e-017

2. Сравнение блоков (частичных выравниваний), найденных MEME, c полным выравниванием, выданным muscle.

Открываем в JalView выравнивание последовательностей, полученное программой muscle. Команда:
muscle -in myproteins.fasta -out myproteins_muscle.fasta
Выделяем разными цветами участки последовательностей, входящих в найденные программой MEME блоки.
Получаем картинку:

mot.png

Сохраняем проект JalView в рабочей директории: myproteins_blocks.jar

Сравним выравнивания MEME и Muscle. Для первого мотива они совпадают. Для второго выравнивания различаются для последовательности AMP_CLOTM на конце выравнивания, немного различаются для FRVX_ECOLI. Для третьего мотива выравнивания совпадают. Думаю, отличия в выравниваниях вызваны присутствием в выравнивании Muscle последовательностей, где мотив не обнаружен.

3. Поиск найденных мотивов в других последовательностях.

Командой
degapseq seed.msf seed.fasta
извлекаем последовательности из выравнивания.
Запускаем программу emast:
emast -dfile seed.fasta memeout.txt mastout.html

Выдача MAST
1. Всего найдено 69 последовательностей с этими мотивами.
2. Все мотивы нашлись в 55 последовательностях.
3. Выравнивание Pfam не везде соответствует мотивам.


© Фоменко Елена.