В наборе гомологов белка из лист-файла myptoteins.list ищу мотивы программой MEME.
Для этого запускаю на kodomo программу ememetext командой:
ememetext @myproteins.list memeout.txt temp.fasta - nmotifs 3
В результате получаем файлы temp.fasta и memeout.txt, содержащий информацию о трех мотивах.
В каких последовательностях найден | Координаты в последовательности PTAS_BACSU | P-value | Длина мотива | E-value | |
Первый мотив | Во всех 10 | 258-307 | 7.69e-53 | 50 | 1.1e-227 |
Второй мотив | Во всех 10 | 107-156 | 1.82e-48 | 50 | 4.1e-193 |
Третий мотив | Во всех 10 | 196-236 | 6.76e-37 | 41 | 4.9e-109 |
Строим выравниване последовательностей, выбранных нами белков, с помощью команды muscle, выполняя команду : muscle -in myproteins.fasta -out myproteins_muscle.fasta. Откроем полученное выравнивание в JalView:
Первый и второй мотивы, раскрашенные голубым и зеленым соответственно, были выровнены muscle, однако, третий мотив, раскрашенный в фиолетовый, не был выровнен в позиции белка PTAS_STAAN. Можно предположить, что последовательность белка PTAS_STAAN не была выровнена, потому что в позициях 623-626 стоят аминокислотые остатки : IDGE. D выравнивается с D в последовательностьях других белков, аналогично и G и E.
Выравнивание с выделенными участками мотивов представлено в файле myproteins_motifs.jar.
Программой MAST проводим поиск мотивов, найденных MEME, в последовательностях, из которых составлено выравнивание PF01515_seed.msf домена PTA_PTB белка PTAS_BACSU, взятое из Pfam: