Главная | Семестры | Проекты | Заметки | О себе | Полезные ссылки |
Поиск мотивов (блоки достоверного выравнивания) среди гомологов белка MRGA_BACSU
Программы MEME и MAST предназначены для локального выравнивания, которое довольно часто имеет больший биологический смысл, чем глобальное. МЕМЕ - наиболее популярная программа множественного локального выравнивания, она находит блоки, т.е.участки локальных выравниваний без гэпов. MAST - программа, которая ищет последовательности с несколькими мотивами.
Т.к. на вход программе MEME (ememe в пакете EMBOSS) подается набор невыровненных последовательностей, то используем следующий fasta-файл: fedorova_sequence.fasta. Выполним на kodomo команду:
ememe fedorova_sequence.fasta MAST -nmotifs 3
"memeout" - имя директории для результатов, в данном случае - MAST; "-nmotifs" задает верхнюю границу числа найденных мотивов; в данном случае - 3, но может оказаться и меньше. Опишем каждый полученный мотив:
Мотив 1 | Мотив 2 | Мотив 3 | |
Число последовательностей | все из выравнивания (21) | все из выравнивания (21) | все из выравнивания (21) |
Длина мотива | 50 | 29 | 21 |
E-value | 3.5e-456 | 6.7e-166 | 1.1e-060 |
Рис.1. LOGO для первого мотива.
Рис.2. LOGO для 2 мотива.
Рис.3. LOGO для 3 мотива.
Сравение блоков, найденных MEME, c полным выравниванием, выданным muscle
Создадим файлы с блоками. Для этого:
1) Из файла meme.txt скопируем выравнивания блоков (разделы вида "Motif 1 in BLOCKS format") в отдельные файлы "motif1.aln", "motif2.aln" и "motif3.aln".
2) Вставим первую строчку "CLUSTAL" в файл, т.к. это является признаком данного формата файла с выравниванием.
3) Переведем файлы "motif1.aln" и др. в формат fasta с помощью следующей команды:
seqret motif1.aln motif1.fasta.
Откроем выравнивание гомологов с полученными блоками в JalView. Проанализируем результат.
Рис.1. Выравнивание гомологов белка MRGA_BACSU и сопоставление его с первым мотивом. Окраска производилась по весу в матрице Blosum.
Рис.2. Выравнивание гомологов белка MRGA_BACSU и сопоставление его со вторым мотивом. Окраска производилась по весу в матрице Blosum.
Рис.3. Выравнивание гомологов белка MRGA_BACSU и сопоставление его с третим мотивом. Окраска производилась по весу в матрице Blosum.
Ссылка на проект:
fedorova_project
Оказалось, что все блоки совпали с выравниванием.
Поиск найденных мотивов в других последовательностях
Проведем программой MAST поиск мотивов, найденных программой MEME, в последовательностях, из которых составлено выравнивание (seed) одного из доменов белка MRGA_BACSU - Ferritin-like. Для этого сделаем следующее:
1) Извлечем последовательности из выравнивания (то есть уберем знаки пробелов и переведем в fasta-формат) программой degapseq:
degapseq alignment.msf alignment.fasta
2) Запустим программу emast:
emast -dfile alignment.fasta meme.txt mastout.html
Используем ее стандартные параметры, -dfile указывает файл для поиска.
Получим на выходе html-страничку: mastout.html
Всего 119 последовательностей.
1 мотив встречается в 60 последовательностях;
2 мотив - в 80;
3 мотив - в 20.
Не все последовательности из выравнивания содержат хотя бы один мотив. Все 3 мотива содержат только 14 последовательностей. Таким образом, выравнивания фрагментов с мотивами не очень удачны, поскольку все три мотива встречаются в малом числе последовательностей, а в некоторых даже не встречается ни один.