Поиск мотивов, программы MEME и MAST

MEME (Multiple Em for Motif Elicitation)- программа множественного локального выравнивания, ищущая блоки - участки множественного выравнивания без гэпов.
С помощью входящей в пакет EMBOSS программы был произведён поиск мотивов в выборке гомологов OXDC_BACSU (см. подробнее здесь).
Вид запроса: ememe sequences.fasta memeout3 -nmotifs 3
memeout3 - имя директории для результатов, -nmotifs - задаёт максимальное число найденных мотивов. Посмотреть выдачу программы. Результаты поиска приведены в таблице 1.



Табл.1 Некоторые характеристики найденных мотивов
Мотив Сколько последовательностей содержит E-value LOGO
MOTIF 1 31 3.8e-518
MOTIF 2 31 1.3e-346
MOTIF 3 27 8.6e-343
LOGO - графическое изображение консервативности мотива. Высота столбика характеризует консервативность позиции, а соотношение размера букв в нём пропорционально соотношению частот встречаемости их в данной позиции

Сравнение мотивов, полученных с помощью MEME и множественного выравнивания из MUSCLE

Как видно из рисунка 1, мотивы совпадают с точностью до гэпов (выравнивая первый и третий мотивы MEME убрала несколько последовательностей, так стало возможным сделать блок шире).



Рис.1 Сравнение множественного выравнивания из MUSCLE и найденных мотивов (кликабельно)
Проект jar

Поиск мотивов в других последовательностях

При помощи MAST можно искать в различных последовательностях мотивы, выделенные МЕМЕ. Был произведён поиск найденных мотивов в выравнивании seed из Pfam-a (см. пр. 10). Сначала из выравнивания были удалены гэпы и оно было пересохранено в формат .fasta помощью следующей команды на kodomo: degapseq seed.txt seed.fasta
Затем был произведён поиск в нём мотивов с помощью следующего запроса: emast -dfile seed.fasta memeout.txt mastout.html
Результаты работы программы MAST

Анализ результатов:
  • Из 225 взятых последовательностей MOTIF1 встретился в 141 последовательности, из них 5 раз - удвоенный. MOTIF2 - в 149 последовательностях, MOTIF3 - в 33. Первый мотив и третий вместе не встречались. В нескольких последовательностях нет ни одного из трёх мотивов.
  • В скольких нашлись все мотивы? Ни в одной, как ни странно, даже в OXDC_BACSU не нашлись все три.
  • Соответствует ли выравнивание, взятое из Pfam, мотивам? Причиной этого может быть то, что домены в Pfam имеют в разы большую протяжённость, чем найденные MEME мотивы. Возможно, в случае рассмотрения более крупного участка в качестве мотива для тех последовательностей, для которых не нашлось ни одного домена, что-то бы тоже нашлось.