MEME & MAST


1. Поиск мотивов программой MEME

- для поиска мотивов нам необходим список гомологов белка THIE_BACSU, полученный при выполнении задания №8. Итак, у нас есть файл с последовательностями.

- теперь чтобы выполнить непосредственно сам поиск мотивов по файлу с последовательностями напишем команду:

ememe sequences.fasta memeout -nmotifs 3

- мы получаем папку memeout с файлами выдачи, нас интересует файл meme.html, используя который, мы заполняем таблицу:

Мотив Число последовательностей Длина мотива E-value LOGO
1 35 (из 40) 33 3.0e-598
2 39 (из 40) 21 4.8e-290
3 34 (из 40) 29 3.0e-276

2. Сравнение блоков, найденных MEME, c полным выравниванием, выданным muscle

Используя файл с последовательностями, построим множественное выравнивание при помощи программы muscle. Для этого напишем команду:

muscle -in
sequences.fasta -out sequences_aligned_muscle.fasta

Теперь создадим файлы с блоками:

- из файла meme.txt скопировали выравнивания блоков (разделы вида "Motif 1 in BLOCKS format") в отдельные файлы "motif1.aln", "motif2.aln", "
motif3.aln"
- вставили в каждый файл первую строчку "CLUSTAL" (это признак данного формата файла с выравниванием)
- перевели файлы "motif1.aln", "motif2.aln", "motif3.aln" в формат fasta с помощью команды:

seqret motif1.aln motif1.fasta

Далее, используя программу 
JalViewмы можем сравнить построенное выравнивание и блоки MEME.
Блок выравнивания обведён красным пунктиром, а последовательности присутствующие и в мотиве, и в глобальном выравнивании выделены серым фоном для наглядности.

Сравнение участка глобального выравнивания и мотива №1



Если убрать первые 5 последовательностей в выравнивании, которые не присутствуют в мотиве, то промежутки с гэпами уйдут, и мотив совпадёт с выравниванием.

Сравнение участка глобального выравнивания и мотива №2



Если "схлопнуть" гэпы, то мотив и выравнивание совпадут. Единственное, что стоит отметить - это три последовательности (2-я, 16-я, 19-я → для них совпадение с мотивом идёт начиная с позиций 1241, 1241 и 1240 соответственно), из-за которых образовались три гэпа подряд у остальных последовательностей.

Сравнение участка глобального выравнивания и мотива №3



Здесь снова, если "схлопнуть" гэпы, то мотив совпадёт с выравниванием. За исключением четырёх последовательностей (8-й, 9-й, 11-й, 19-й → для них совпадение с мотивом заканчивается на позициях 1120, 1121, 1122 и 1121 соответственно), из-за которых образовались четыре гэпа подряд у остальных последовательностей.

Глобальное выравнивание и все три мотива можно посмотреть в проекте JalView.

3. Поиск найденных мотивов в других последовательностях программой MAST

- при помощи программы MAST выполним поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) домена TMP-TENI белка THIE_BACSU
- используя команду degapseq, уберём знаки пробелов и переведём в fasta-формат последовательности из выравнивания. Для этого напишем команду:

degapseq PF02581.msf PF02581.fasta

В результате получим файл с последовательностями.

- затем выполним команду:

emast -dfile PF02581.fasta meme.txt mastout.html

В итоге получаем html-страничку. Ознакомившись с информацией этой страницы, отметим некоторые пункты:

• всего последовательностей 89 (которые включает в себя PF02581.fasta)
• первый мотив нашёлся в 84 последовательностях, второй - в 84-х, третий - в 78-ми
• все 3 мотива нашлись в 73-х последовательностях
• исходя из столь высоких показателей по нахождению мотивов в последовательностях, можно уверенно сказать, что выравнивание, взятое из Pfam, соответствует всем трём мотивам



© Novikova Maria, 2012
Последнее обновление: 23.05.2013