Поиск мотивов, программы MEME и MAST.
Поиск мотивов среди гомологов белка TENA_BACSU
На сервере kodomo программой ememe был осуществлён поиск мотивов среди гомологов белка TENA_BACSU, взятых из репрезентативной выборки с практикума 8. Результат работы программы представлен на отдельной html-странице.
Так как на поиск накладывалось ограничение с выдачей не более 3х мотивов, программой ememe и было найдено 3 мотива. Информация о них содержится в таблице 1.
Таблица 1. Характеристика мотивов белка TENA_BACSU.
№
| Число последовательностей в нём
| Длина мотива
| E-value
| LOGO
|
1
| 40 (все)
| 46
| 8.9*10-702
|
|
2
| 31
| 37
| 6.0*10-354
|
|
3
| 40 (все)
| 41
| 2.8*10-357
|
|
Сравнение блоков, найденных MEME, c полным выравниванием, выданным muscle
Из выдачи программы ememe были получены три файла в FASTA-формате, содержащие участки последовательностей формирующие три вышеописанных мотива. Это было сделано с помощью команды seqret, транслирующей последовательности из формата .aln (выровненные последовательности) в формат .fasta.
В Jalview одновременно анализировались тотальное выравнивание всей выборки и найденные мотивы. Пример проведения визуального сравнения представлен на рисунке 1 .
Рисунок 1. Визуальное сравнение локального выравнивания и мотивов, обнаруженных с помощью MEME. Использована стандартная окраска аминокислотных остатков ClustalX без ограничения на степень консервативности.
Как видно из рисунка 1, множественное и локальные выравнивния совпали с большой точностью. Единственные отличия - программа Muscle
вставила несколько колонок гэпов между блоками, что не совершила MEME.
Поиск найденных мотивов в других последовательностях
Проведем программой MAST поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) одного из доменов белка TENA_BACSU - TENA_THI-4. Для этого делаем следующее:
- Извлекаем последовательности из выравнивания (то есть убераем знаки пробелов и переводим в fasta-формат) программой degapseq:
degapseq seed.msf seed.fasta
- Запускаем программу emast:
emast -dfile seed.fasta meme.txt mastout.html
Используем стандартные параметры программы.
В результате получаем html-страничку: mastout.html
Краткое описания результатов деятельности программы:
- Во входном файле из Pfam было выравнивание из 25 последовательностей.
- По результатам MEME в 4х последовательностях нет ни одного из 3х мотивов.
- В 20 последовательностях есть первый мотив, в 13- второй мотив, в 12- третий мотив .
- Все 3 мотива содержаться в 11 последовательностях.
© Nosikova Kate, 2012