Мотивы, работа программ MEME и MAST

Работа с программой MEME

Я сделал запрос на кодомо here would be picture but it's missed. Sorry :(
где PDUOhomologs - файл с последовательностями гомолога моего белка.

файл memeout

Программа нашла 3 мотива, с очень маленькики E-value, так что я повторил запрос, но в выдаче уже я указал 10 мотивов,
из них 5 с E-value меньше 1*10-3, и в пятой было только 3 белка(у меня 8 белков, из них 5 прокариотических,
и 3 эукариотических, и этот мотив найден только у эукариотических белков, а значит, к моему отношения не имеет) так что
речь будет дальше идти об этих четырех мотивах
номер мотива В скольких белках нашелся(из восьми) координаты в PDUO_BACSU P-value для PDUO_BACSU E-value длина
1 8 89 - 138 1.18e-44 7.7e-137 50
2 7 - - 2.8e-106 50
3 7 139 - 180 9.01e-34 2.5e-075 41
4 7 54 - 82 2.02e-23 3.2e-045 29



Сравнение блоков, найденных MEME, c полным выравниванием, выданным muscle

here would be picture but it's missed. Sorry :(

файл JalView

Я разметил блоки по PDUO_BACSU, а во втором блоке(но на картинке он идет первым), где в мотив не попал PDUO_BACSU, я разметил блок по PDUO_CITFR. Вообще, меня очень удивляет, почему белки быка, человека и мыши так похожи на бактериальные, причем все бактерии - из Fermicutes.

Вообще, выравнивание Muscle много где не совпадает с найденными мотивами, но, если присмотреться, видно, что большая часть выравнивания не совпадает с мотивами ровно в том месте, где в угоду "плохой" последовательности, создаются гэпы в других.


Поиск найденных мотивов в других последовательностях



Я взял файл с доменами из предыдущего задания, и создал файл с fasta последовательностями на его основе программой degapseq

После, используя программу mast на кодомо я получил html файл с

файл mastout

1 - Первый мотив нашелся в 169 из 171 последовательности(нету у двух белков с E-value больше единицы) Второй - всего лишь у двух, третий - у двух, а четвертый у 129
2 - Все мотивы не нашлись ни в одном белке(в Pfam оказались только два белка из гомологов PDUO_BACSU, но и в них обнаружились не все мотивы =()
3 - Нет, выравнивание из Pfam не соответствует мотивам