Учебный сайт Фоменко Елены
Главная | Семестры | Проекты | Заметки |
1. Поиск мотивов программой MEME.
Берем файл с последовательностями myproteins.fasta и через putty выполняем команду в рабочей директории:
ememetext myproteins.fasta memeout.txt temp.fasta -nmotifs 3
Также можно было взять лист-файл myproteins.list и выполнить команду
ememetext @myproteins.list memeout.txt temp.fasta -nmotifs 3
Получаем файл memeout.txt. Составим таблицу по результатам изучения файла:
Номер мотива | Во всех ли последовательностях нашелся? | Координаты в последовательности YSCD_BACSU | P-value в последовательности YSCD_BACSU | Длина | E-value |
1 | в 5 из 7 | 59-104 | 7.14e-50 | 46 | 1.6e-044 |
2 | в 5 из 7 | 200-249 | 1.30e-47 | 50 | 1.9e-022 |
3 | в 5 из 7 | 300-335 | 1.59e-33 | 36 | 2.1e-017 |
2. Сравнение блоков (частичных выравниваний), найденных MEME, c полным выравниванием, выданным muscle.
Открываем в JalView выравнивание последовательностей, полученное программой muscle. Команда:
muscle -in myproteins.fasta -out myproteins_muscle.fasta
Выделяем разными цветами участки последовательностей, входящих в найденные программой MEME блоки.
Получаем картинку:
Сохраняем проект JalView в рабочей директории: myproteins_blocks.jar
Сравним выравнивания MEME и Muscle. Для первого мотива они совпадают. Для второго выравнивания различаются для последовательности AMP_CLOTM на конце выравнивания, немного различаются для FRVX_ECOLI. Для третьего мотива выравнивания совпадают. Думаю, отличия в выравниваниях вызваны присутствием в выравнивании Muscle последовательностей, где мотив не обнаружен.
3. Поиск найденных мотивов в других последовательностях.
Командой
degapseq seed.msf seed.fasta
извлекаем последовательности из выравнивания.
Запускаем программу emast:
emast -dfile seed.fasta memeout.txt mastout.html
Выдача MAST
1. Всего найдено 69 последовательностей с этими мотивами.
2. Все мотивы нашлись в 55 последовательностях.
3. Выравнивание Pfam не везде соответствует мотивам.