Поиск мотивов, программы MEME и MAST

Главная Семестры Проекты Заметки О себе Полезные ссылки


Поиск мотивов (блоки достоверного выравнивания) среди гомологов белка MRGA_BACSU

Программы MEME и MAST предназначены для локального выравнивания, которое довольно часто имеет больший биологический смысл, чем глобальное. МЕМЕ - наиболее популярная программа множественного локального выравнивания, она находит блоки, т.е.участки локальных выравниваний без гэпов. MAST - программа, которая ищет последовательности с несколькими мотивами.
Т.к. на вход программе MEME (ememe в пакете EMBOSS) подается набор невыровненных последовательностей, то используем следующий fasta-файл: fedorova_sequence.fasta. Выполним на kodomo команду:
ememe fedorova_sequence.fasta MAST -nmotifs 3
"memeout" - имя директории для результатов, в данном случае - MAST; "-nmotifs" задает верхнюю границу числа найденных мотивов; в данном случае - 3, но может оказаться и меньше. Опишем каждый полученный мотив:
Мотив 1 Мотив 2 Мотив 3
Число последовательностей все из выравнивания (21) все из выравнивания (21) все из выравнивания (21)
Длина мотива 50 29 21
E-value 3.5e-456 6.7e-166 1.1e-060

Рис.1. LOGO для первого мотива.


Рис.2. LOGO для 2 мотива.


Рис.3. LOGO для 3 мотива.



Сравение блоков, найденных MEME, c полным выравниванием, выданным muscle

Создадим файлы с блоками. Для этого:
1) Из файла meme.txt скопируем выравнивания блоков (разделы вида "Motif 1 in BLOCKS format") в отдельные файлы "motif1.aln", "motif2.aln" и "motif3.aln".
2) Вставим первую строчку "CLUSTAL" в файл, т.к. это является признаком данного формата файла с выравниванием.
3) Переведем файлы "motif1.aln" и др. в формат fasta с помощью следующей команды:
seqret motif1.aln motif1.fasta.

Откроем выравнивание гомологов с полученными блоками в JalView. Проанализируем результат.


Рис.1. Выравнивание гомологов белка MRGA_BACSU и сопоставление его с первым мотивом. Окраска производилась по весу в матрице Blosum.


Рис.2. Выравнивание гомологов белка MRGA_BACSU и сопоставление его со вторым мотивом. Окраска производилась по весу в матрице Blosum.


Рис.3. Выравнивание гомологов белка MRGA_BACSU и сопоставление его с третим мотивом. Окраска производилась по весу в матрице Blosum.

Ссылка на проект:
fedorova_project

Оказалось, что все блоки совпали с выравниванием.

Поиск найденных мотивов в других последовательностях

Проведем программой MAST поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) одного из доменов белка MRGA_BACSU - Ferritin-like. Для этого сделаем следующее:
1) Извлечем последовательности из выравнивания (то есть уберем знаки пробелов и переведем в fasta-формат) программой degapseq:
degapseq alignment.msf alignment.fasta
2) Запустим программу emast:
emast -dfile alignment.fasta meme.txt mastout.html
Используем ее стандартные параметры, -dfile указывает файл для поиска.
Получим на выходе html-страничку: mastout.html
Всего 119 последовательностей.
1 мотив встречается в 60 последовательностях;
2 мотив - в 80;
3 мотив - в 20.
Не все последовательности из выравнивания содержат хотя бы один мотив. Все 3 мотива содержат только 14 последовательностей. Таким образом, выравнивания фрагментов с мотивами не очень удачны, поскольку все три мотива встречаются в малом числе последовательностей, а в некоторых даже не встречается ни один.