Поиск мотивов, программы MEME и MAST.

Я создала лист-файл с "адресами" последовательностей и запустите на kodomo программу ememetext следующим образом:
R ememetext @myproteins.list memeout.txt temp.fasta -nmotifs 3
и занесла в таблицу:
1) сколько мотивов найдено;
2) для каждого мотива: во всех ли последовательностях он нашёлся, координаты и P-value в вашей последовательности, характеристики мотива: длину и E-value.
Номер мотива Последовательности, в которых найден мотив Координаты в последовательности IOLA_BACSU P-value в последовательности IOLA_BACSU Длина E-value
1 Мотив найден в IOLA_BACSU, IOLA1_OCEIH, IOLA1_GEOKA, IOLA_LACCA, MMSA_MOUSE
139-189
7.70e-60
50
1.5e-103
2 Мотив найден в IOLA_BACSU, IOLA1_OCEIH, IOLA1_GEOKA, IOLA_LACCA, MMSA_MOUSE
432-486
8.46e-59
50
5.5e-075
3 Мотив найден в IOLA_BACSU, IOLA1_OCEIH, IOLA1_GEOKA, IOLA_LACCA, MMSA_MOUSE
217-267
2.01e-56
50
4.5e-074

2.Сравнение блоков (частичных выравниваний), найденных MEME, c полным выравниванием, выданным muscle.

С помощью программы muscle я получила следующее выравнивание, воспользовавшись командой :
muscle -in myproteins.fasta -out myproteins_aligned_muscle.fasta
С помощью программы JalView я раскрасила первый, третий, второй мотив соответственно и получила следующую картинку. Мотивы оказались выровнены.

первый, третий, второй мотивы
файл с выравниванием

3. Поиск найденных мотивов в других последовательностях

Я извлекла последовательность из выравнивания PF00171_seed.msf, полученного в прошлом д/з, с помощью команды :
degapseq PF00171_seed.msf seed.fasta
За тем я вызвала команду
emast -dfile seed.fasta memeout.txt mastout.html
1) Первый мотив нашелся в 118 последовательностях из 120 и в 2 из них два раза,
второй - в 1 из 118 последовательностей,
третий - в 101 из 118 и в 5 из них два раза.
2) Только в одной последовательности встречаюся сразу все три мотива.
3) Не выравниванеи из Pfam не всегда соответствует мотивам соответствует

© Julia Chudakova