Поиск мотивов (блоков достоверного выравнивания) среди гомологов белка YPWA_BACSU
В данном разделе с помощью программы MEME (ememe, входящей в пакет EMBOSS) производился поиск возможных гомологов. На вход программе подаются последовательности вероятных гомологов, а программа проводит поиск мотивов внутри этих гомологов. Синтаксис команды может быть в двух вариантах:ememe @sequences memeout -nmotifs 3
( если используется файл с "адресами" последовательностей)ememe sequences.fasta memeout -nmotifs 3
memeout - имя директории для результатов
-nmotifs 3 - задает верхнюю границу найденных мотивов
Табл. 1. Отчет о мотивах в последовательностях гомологов | |||||||||||||||||||||||
Число последовательностей | Длина мотива | E-value | LOGO |
все | 36 | 1.8e-594 | |
29 из 30 | 41 | 4.5e-620 | |
29 из 30 | 41 | 4.5e-620 | |
28 из 30 | 29 | 6.0e-459 | |
27 из 30 | 41 | 1.5e-414 |
Анализ блоков MEME и выравнивавния Muscle
Среди выдачи программы MEME были выделены в разные файлы блоки, содержащие разные мотивы.Затем файлы были конвертированы из формата .aln в формат .fasta путем добавления в первую строчку выдачи программы слова CLUSTAL и команды seqret motif1.aln motif1.fasta. Файл с созданным в JalView проектом c блоками и глобальным выравниванием находится здесь.
Блоки довольно хорошо совпадают с выравниванием, однако есть и различия. Для удобства внутри мотивы местами разбиты на несколько кусочков, чтобы было легче проследить схожесть.
Мотив 1
Первый мотив неидеально совпадает с участком глобального выравнивания. В блоке присутствуют не все последовательности, хотя все остатки стоят на аналогичных местах.Рис. 1. Сравнение мотива 1 и участка глобального выравнивания |
Мотивы 2 и 3
Во втором блоке отсутствует одна последовательность, поэтому его нельзя назвать полностью сходным с участком глобального выравнивания. Эта последовательность обязует глобальное выравнивание вставлять гэпы, поэтому MEME избавился от нее для создания полноценного блока. Аналогичная ситуация происходит и с мотивом 3.Рис. 2. Сравнение мотива 2 и участка глобального выравнивания |
Рис. 3. Сравнение мотива 3 и участка глобального выравнивания |
Поиск найденных мотивов в других последовательностях
На данном этапе, с помощью программы MAST проводился поиск найденных MEME мотивов в фрагментах белков, гомологичных белковому домену. Для этого было проведено 2 этапа:- Командой degapseq seed.msf seed.fasta файл с выравниванием фрагментов переведен в fasta-формат. Файл содержал 3 последовательности.
- Командой emast -dfile seed.fasta memeout.txt mastout.html запущен скрипт поиска мотивов в выравнивании
По этим данным,
- Первый, второй и третий мотивы нашлись во всех трех последовательностях.
- Второй мотив дважды встречается в одной из трех последовательностей (подробности по ссылке).
- E-value колеблется от 1.4e-89 до 1.5e-46, что подтверждает гомологию фрагментов.