MEME & MAST
1. Поиск
мотивов программой MEME
- для поиска мотивов нам необходим список гомологов белка THIE_BACSU, полученный
при выполнении задания
№8. Итак, у нас есть файл с
последовательностями.
- теперь чтобы выполнить непосредственно сам поиск мотивов по файлу с
последовательностями напишем команду:
ememe sequences.fasta memeout -nmotifs 3
- мы получаем папку memeout с файлами выдачи, нас интересует файл
meme.html, используя который, мы
заполняем таблицу:
Мотив |
Число последовательностей |
Длина мотива |
E-value |
LOGO |
1 |
35 (из 40) |
33 |
3.0e-598 |
|
2 |
39 (из 40) |
21 |
4.8e-290 |
|
3 |
34 (из 40) |
29 |
3.0e-276 |
|
2. Сравнение
блоков, найденных MEME, c полным выравниванием, выданным muscle
Используя файл
с последовательностями, построим множественное
выравнивание при помощи
программы muscle.
Для этого напишем команду:
muscle -in
sequences.fasta
-out
sequences_aligned_muscle.fasta
Теперь создадим файлы с блоками:
- из файла meme.txt скопировали выравнивания блоков (разделы вида "Motif 1 in
BLOCKS format") в отдельные файлы "motif1.aln", "motif2.aln", "motif3.aln"
- вставили в каждый файл первую строчку "CLUSTAL" (это признак данного формата
файла с выравниванием)
- перевели файлы "motif1.aln", "motif2.aln", "motif3.aln"
в формат fasta с помощью команды:
seqret motif1.aln motif1.fasta
Далее, используя программу JalView, мы
можем сравнить построенное выравнивание
и блоки MEME.
Блок выравнивания обведён красным пунктиром, а последовательности присутствующие
и в мотиве, и в глобальном выравнивании выделены серым фоном для наглядности.
Сравнение участка глобального выравнивания и мотива №1
Если убрать первые 5 последовательностей в выравнивании, которые не присутствуют
в мотиве, то промежутки с гэпами уйдут, и мотив совпадёт с выравниванием.
Сравнение участка глобального выравнивания и мотива №2
Если "схлопнуть" гэпы, то мотив и выравнивание совпадут. Единственное, что стоит
отметить - это три последовательности (2-я, 16-я, 19-я → для них совпадение с
мотивом идёт начиная с позиций 1241, 1241 и 1240 соответственно), из-за которых
образовались три гэпа подряд у остальных последовательностей.
Сравнение участка глобального выравнивания и мотива №3
Здесь снова, если "схлопнуть" гэпы, то мотив совпадёт с выравниванием. За
исключением четырёх последовательностей (8-й, 9-й, 11-й, 19-й → для них
совпадение с мотивом заканчивается на позициях 1120, 1121, 1122 и 1121
соответственно), из-за которых образовались четыре гэпа подряд у остальных
последовательностей.
Глобальное выравнивание и все три мотива можно посмотреть в
проекте JalView.
3. Поиск
найденных мотивов в других последовательностях программой
MAST
- при помощи программы MAST выполним поиск мотивов, найденных программой MEME, в
последовательностях, из которых составлено выравнивание (seed)
домена TMP-TENI белка THIE_BACSU
- используя команду degapseq, уберём знаки пробелов
и переведём в fasta-формат последовательности из выравнивания. Для этого напишем
команду:
degapseq PF02581.msf PF02581.fasta
В результате получим файл с последовательностями.
- затем выполним команду:
emast -dfile PF02581.fasta meme.txt mastout.html
В итоге получаем html-страничку.
Ознакомившись с информацией этой страницы, отметим некоторые пункты:
• всего последовательностей 89 (которые
включает в себя PF02581.fasta)
• первый мотив нашёлся в 84 последовательностях, второй - в 84-х, третий - в
78-ми
• все 3 мотива нашлись в 73-х последовательностях
• исходя из столь высоких показателей по нахождению мотивов в
последовательностях, можно уверенно сказать, что выравнивание, взятое из Pfam, соответствует
всем трём мотивам
© Novikova Maria, 2012
Последнее обновление: 23.05.2013