Учебная страница курса биоинформатики,
год поступления 2012
Поиск мотивов, программы MEME и MAST
1. Найдите мотивы (блоки достоверного выравнивания) среди гомологов вашего белка
На вход программе MEME (ememe в пакете EMBOSS) подается набор невыровненных последовательностей - вероятных гомологов вашего белка. Два варианта их задания:
(1) Создайте лист-файл sequences с "адресами" последовательностей (пример)
(2) Создайте файл sequences.fasta с последовательностями в формате fasta
- Выполните на kodomo программу ememe:
ememe @sequences memeout -nmotifs 3 или
ememe sequences.fasta memeout -nmotifs 3
"@" перед именем файла значит, что это лист-файл.
"memeout" - имя директории для результатов
"-nmotifs" задает верхнюю границу числа найденных мотивов; меньше может быть
- Просмотрите выдачу программы в формате html — файл "meme.html".
- Для каждого мотива занесите в отчёт:
- число последовательностей в нем ("все" - если встретился во всех последовательностях)
- длину мотива
- E-value
- LOGO
2. Сравните блоки, найденные MEME, c полным выравниванием, выданным muscle
- Создайте файлы с блоками:
- из файла meme.txt скопируйте выравнивания блоков (разделы вида "Motif 1 in BLOCKS format", в них блоки без флангов) в отдельные файлы "motif1.aln", "motif2.aln" и т.п.;
- вставьте первую строчку "CLUSTAL ", это признак данного формата файла с выравниванием
- переведите файлы "motif1.aln" и др. в формат fasta:
seqret motif1.aln motif1.fasta . По умолчанию, выходной файл seqret и др. программ EMBOSS - в формате fasta (Замечание.
Откройте в JalView одновременно и выравнивание ваших последовательностей, и все найденные блоки; сравните их визуально.
- Про каждый блок напишите совпадает его выравнивание с полным выравниванием, или нет. Несовпадение может заключаться либо в том, что в блоке не все последовательности, либо в том, что конкретные остатки в одном выравнивании стоят друг под другом, а в другом - нет.
Если найдется блок, не совпадающий с полным выравниванием, то постарайтесь описать и/или выделить средствами JalView, различия.
- Напишите вывод из сравнения; постарайтесь найти объяснения различиям, если таковые были.
Сохраните проект JalView (файл с расширением jar).
3. Поиск найденных мотивов в других последовательностях
Проведите программой MAST поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) одного из доменов вашего белка, взятое из Pfam (см. предыдущее занятие, задание 2). Этапы:
- извлеките последовательности из выравнивания (то есть уберите знаки пробелов и переведите в fasta-формат) программой degapseq:
degapseq seed.msf seed.fasta
- запустите программу emast:
emast -dfile seed.fasta memeout.txt mastout.html
на вопросы программы отвечайте по умолчанию (нажатием <Enter>). Откройте полученный файл (mastout.html) браузером. В отчёт вставьте гиперссылку на этот файл, а также следующую информацию: 1) в скольких последовательностях (из стольких-то, имевшихся в seed.fasta) нашёлся каждый из мотивов? 2) в скольких нашлись все мотивы? 3) соответствует ли выравнивание, взятое из Pfam, мотивам? (если нет, приведите пример несоответствия).
Дополнительные задания
Опробуйте сервис MEME Suite (на том же или другом материале). Если выполняете это задание, то опишите не просто результаты, но главное – свои впечатления, замечания, неясные моменты.
Объясните карту локального сходства, построенную для последовательности белка TALe против самой себя. Рекомендуемый сервис: DotHelix на сайте genebee