Множественные выравнивания. Pfam
При помощи BLAST были выбраны семь гомологов гипотетического белка A.pernix (идентификатор NP_147299.2).
Необходимо выровнять эти белки разными способами. Сначала используем программу пакета EMBOSS -- MUSCLE (MUltiple Sequence Comparison by Log-Expectation). Подадим на вход такую строчку с именами входного и выходного файлов:
muscle -in 7seq.fasta -out muscle.fasta
Для построения множественных выравниваний также часто используется Mafft (Multiple Alignment using Fast Fourier Transform). Результат можно увидеть на рисунке 1.

Для того, что сравнить два полученных выравнивания, попробуем выровнять их между собой опять же с помощью Muscle. В итоге начальные участки выровнялись, и почти все консервативные столбцы теперь в одинаковых позициях (fasta-файл). Я считаю, что обе программы справились с задачей хорошо, ведь есть только незначительные различия позиций отдельных консервативных столбцов в начале последовательностей. А консервативные столбцы домена (84-151 позиции) четко отмечены в обоих выравниваниях, что значительно в для понимания происхождения.
Для поиска информации о домене я использовала базу данных Pfam. Домен PUA (PseudoUridine synthase and Archaeosine transglycosylase) изучен слабо. Как подсказавают Pfam и Interpro, этот мотив отвечает за связывание РНК. Он представлен в белках широкого спектра архей, бактерии, эукариот. Некоторые ферменты эукариот, имеющие эту последовательность, катализируют пост-трансляционные изменения РНК, синтез рибосом и другое. Мотив часто встречаемся в киназах. Указывая на связь метаболизма РНК и болезней, эти мотивы имеют отношение к таким болезням как врожденный дискератоз и рак.
Здесь можно посмотреть seed-выравнивание семейства.
На рисунке 2 представлена диаграмма распространения белков этой семьи.
