Учебный сайт Софроновой Алины
Построение множественного выравнивания. Pfam

        При помощи программ BLAST и PSI-BLAST я выбрала 8 гомологов белка сукцинилглутамат десукцинилаза\аспартоацилаза (succinylglutamate desuccinylase/aspartoacylase) из генома бактерии Shewanella frigidimarina NCIMB 400. В базе данных UniProt/SwissProt был найден только один гомолог, причем недостоверный (E-value 3.1), поэтому я сменила базу данных на RefSeq. Находки имеют достаточно большое покрытие (92-93%), индентичность колеблется в пределах 50-60%. Полученные белки можно считать достоверными гомологами, так как значение E-value не превышает 1e-5. Файл с последовательностями выбранных белков можно скачать здесь.
Для построения множественное выравнивание данных последовательностей я воспользовалась программой muscle на сервере kodomo. Для этого я использовала команду: muscle -in seqhom.fasta -out muscle.fasta, где -in - файл в fasta-формате, из которого берут последовательности, -out - файл в fasta-формате, содержащий выравнивание. Полученный файл можно просмотреть здесь. Данное выравнивание в программе Jalview можно увидеть на Рис.1.

Рис.1. Множественное выравнивание найденных белков гомологов при помощи программы muckle. Раскраска Clustalx. Консервативность более 70%.

        Далее я постоила выравнивание этих же последовательностей, но используя программу mafft на сервере kodomo. Я использовала команду: mafft seqhom.fasta > mafft.fasta. До знака ">" файл, из которого берут последовательности, а после ">" выходной файл. Полученный файл можно просмотреть здесь. Данное выравнивание в программе Jalview можно увидеть на Рис.2.

Рис.2. Множественное выравнивание найденных белков гомологов при помощи программы mafft. Раскраска Clustalx. Консервативность более 70%.

        Я сравнила полученные выравнивания. Для этого я просто добавила выравнивание, полученное при помощи программы mafft, в окно с выравниванием в программе muscle. Для удобства сравнения я поменяла порядок последовательностей, так чтобы последовательность из первого выравнивания соответствовала этой же последовательности из друго выравнивания. Результат представлен на Рис.3. Выравнивания полностью совпали. Гэпы присутствуют только в начале последовательностей, что свидетельствует только об их различной длине.

Рис.3. Сравнение множественных выравниваний белков при помощи программ muscle и mafft. Раскраска Clustalx. Консервативность более 70%.
Pfam

        Я нашла последовательность моего белка на сайте pfam, использовав идентификатор 3lwu. В итоге мой белок содержит один домен с координатами 33-365, относящийся к pfam-семейству AstE_AspA (PF04952) или Succinylglutamate desuccinylase / Aspartoacylase family. Я сохранила seed-выравнивание этого семейства. Файл с выравниванием можно скачать здесь. Выравнивание представлено на Рис.4.

Рис.4. Множественное выравнивание семейства белков AstE_AspA (PF04952). Раскраска Clustalx. Консервативность более 70%.
Проект с выравниваниями можно скачать здесь.

Вернуться к 2 семестру

© Алина Софронова, 2013
Дата последнего изменения: 28.11.2013