Поиск мотивов, программы MEME и MAST
Консольная версия программы MEME
МЕМЕ – наиболее популярная программа множественного локального выравнивания, она находит блоки
(т.е.участки локальных выравниваний без гэпов).
На kodomo введем в командную строку "ememe". Нам предложат ввести файл с последовательностями белков (в нашем случае
это файл в FASTA - формате с последовательностями гомологов белка YQGN_BACSU). Далее, после нажатия Enter
надо ввести название директории, в которую программа запишет результаты своих действий. Теперь посмотрим файл в формате html —
meme.html.
Для гомологов белка YQGN_BACSU программа meme нашла всего один мотив, длиной 29 аминокислотных остатков.
E-value мотива - 2.3e-499, число последовательностей, в которых встретился мотив - 18.
MEME мотивы описаны в виде вероятностно позиционно-спецефичной матрицей, которая показывает вероятность
появление каждой возможной аминокислоты в каждой возможной позиции мотива.
Для визуализации матрицы используется так называемое "LOGO последовательности", содержащее набор букв
(однобуквенное обозначение аминокислот) в кадой позиции мотива.
Индивидуальная высота каждой буквы - вероятность появления ее в данной позиции мотива (чем выше буква, тем чаще она встречается
в последовательностях, обладающих мотивом).
Для дальнейшего изучения рассмотриф файл meme.txt
Создадим файлы с блоками:
из файла meme.txt скопируем выравнивание блока (раздел вида "Motif 1 in BLOCKS format") в отдельный файл motif1.aln.
Вставим первую строчку "CLUSTAL ", это признак данного формата файла с выравниванием.
Переведем файл "motif1.aln" в формат fasta:
$ seqret motif1.aln motif1.fasta (По умолчанию, выходной файл seqret и др. программ EMBOSS - в формате fasta)
Откроем в JalView одновременно и выравнивание последовательностей, и найденный блок; сравним их визуально.
В блоке не все последовательности (нет gi|6321031|ref|NP_011110.1| 5-formyltetrahydrofolate cyclo-ligase [Saccharomyces cerevisiae
S288c]). На нижнем рис.2. красным цветом выделена последовательность, которая отсутствует в блоке.
По ссылке доступен проект JalView с выравненными последовательностями
и с последовательностями из блока.
Поиск мотивов при помощи сервиса MEME Suite
Введем с поле "входной файл" - файл в FASTA-формате с последовательностями гомологов белка YQGN_BACSU
(тот же, что и в консольной версии программы).
Нажмем "Start search". Через некоторое время появится страница с результатами.
Из предложенных ссылок выбираем meme.html.
Замечение: остается неясным как долго сервис хранит, полученные результаты.
Поиск найденных мотивов в других последовательностях
(использование программы MAST)
Проведите программой MAST поиск мотивов, найденных программой MEME, в последовательностях,
из которых составлено выравнивание (seed) одного из доменов вашего белка, взятое из Pfam.
(см. Эволюционные домены. Банки Pfam и InterPro)
Извлечем последовательности из выравнивания (то есть уберем знаки пробелов и переведем в fasta-формат) программой degapseq:
$ degapseq PF01812_seed.msf PF01812_seed.fasta
Запустим программу emast:
$ emast -dfile PF01812_seed.fasta meme.txt mastout.html
На вопросы программы отвечаем по умолчанию (нажатием Enter). Откроем полученный файл (mastout.html) браузером.
Мотив, найденный консольной версией программы MEME нашелся во всех 24 последовательностях из PF01812_seed.fasta.
Выравнивание, взятое из Pfam соотвествует мотиву.
© Nuzhdina Ekaterina, 2012