Частичное множественное выравнивание: MEME и MAST


Поиск мотивов (блоков достоверного выравнивания) среди гомологов белка YPWA_BACSU

В данном разделе с помощью программы MEME (ememe, входящей в пакет EMBOSS) производился поиск возможных гомологов. На вход программе подаются последовательности вероятных гомологов, а программа проводит поиск мотивов внутри этих гомологов. Синтаксис команды может быть в двух вариантах:
  1. ememe @sequences memeout -nmotifs 3

    ( если используется файл с "адресами" последовательностей)
  2. ememe sequences.fasta memeout -nmotifs 3

На основе этих данных была заполнена таблица 1. LOGO - это картинка, хорошо иллюстрирующая консенсусную последовательность. Высоты букв пропорциональны их частоте в данной позиции.

Табл. 1. Отчет о мотивах в последовательностях гомологов
Число последовательностей Длина мотива E-value LOGO
все 36 1.8e-594
29 из 30 41 4.5e-620
29 из 30 41 4.5e-620
28 из 30 29 6.0e-459
27 из 30 41 1.5e-414

Анализ блоков MEME и выравнивавния Muscle

Среди выдачи программы MEME были выделены в разные файлы блоки, содержащие разные мотивы.
Затем файлы были конвертированы из формата .aln в формат .fasta путем добавления в первую строчку выдачи программы слова CLUSTAL и команды seqret motif1.aln motif1.fasta. Файл с созданным в JalView проектом c блоками и глобальным выравниванием находится здесь.
Блоки довольно хорошо совпадают с выравниванием, однако есть и различия. Для удобства внутри мотивы местами разбиты на несколько кусочков, чтобы было легче проследить схожесть.

Мотив 1

Первый мотив неидеально совпадает с участком глобального выравнивания. В блоке присутствуют не все последовательности, хотя все остатки стоят на аналогичных местах.
Рис. 1. Сравнение мотива 1 и участка глобального выравнивания

Мотивы 2 и 3

Во втором блоке отсутствует одна последовательность, поэтому его нельзя назвать полностью сходным с участком глобального выравнивания. Эта последовательность обязует глобальное выравнивание вставлять гэпы, поэтому MEME избавился от нее для создания полноценного блока. Аналогичная ситуация происходит и с мотивом 3.
Рис. 2. Сравнение мотива 2 и участка глобального выравнивания

Рис. 3. Сравнение мотива 3 и участка глобального выравнивания

Поиск найденных мотивов в других последовательностях

На данном этапе, с помощью программы MAST проводился поиск найденных MEME мотивов в фрагментах белков, гомологичных белковому домену. Для этого было проведено 2 этапа:
  1. Командой degapseq seed.msf seed.fasta файл с выравниванием фрагментов переведен в fasta-формат. Файл содержал 3 последовательности.
  2. Командой emast -dfile seed.fasta memeout.txt mastout.html запущен скрипт поиска мотивов в выравнивании
В результате был получен файл mast.html.
По этим данным,

© Elizaveta Besedina, FBB 2012
lizaveta@kodomo.fbb.msu.ru