Для выбора гомологов моего белка - переносчика сульфата CysZ (Q5QZI4) была использована программа Blast. Необходимыми условиями хорошей выборки были: гомология почти по всей длине (coverage = 70-90%), отсутствие "почти идентичных" белков (ID = 50-60%), достоверность гомологов (E-value < 1e-5). Для поиска гомологов использовался банк SwissProt. К сожалению, не было найдено белков с coverage < 90% и при этом ID > 50%, поэтому бралась выборка по ID = 45-60%. Выбранные гомологи представлены на рис. 1. Их последовательности вы можете скачать здесь.
Рис. 1. Выбранные для работы гомологи.
С помощью программы muscle на сервере kodomo было простроено выравнивание последовательностей, это выравнивание вы можете скачать
здесь. Его фрагмент представлен на рис. 2.
Для построения выравнивания использовалась команда:
muscle -in 20tr.fasta -out 20trmuscle.fasta
Рис. 2. Фрагмент выравнивания последовательностей, сделанного с помощью программы muscle.
С помощью программы mafft на сервере kodomo было простроено второе выравнивание последовательностей, это выравнивание вы можете скачать
здесь. Его фрагмент представлен на рис. 3.
Для построения выравнивания использовалась команда:
mafft 20tr.fasta > 20trmafft.fasta
Рис. 3. Фрагмент выравнивания последовательностей, сделанного с помощью программы mafft.
Далее было проведено сравнение выравниваний, сделанных с помощью muscle и mafft. Наглядный фрагмент показан на рис. 4. Прект с
выравниваниями и их сравнением в формате jar можно скачать здесь.
Если на участках с малой консервативностью (например 1-47 или 500-580) выравнивания и отличаются, то на участках с высокой
степенью сходства (например 270-370), выравнивания абсолютно идентичны, хотя некоторые последовательности и поменялись местами.
Это объясняется тем, что последовательности очень похожи.
Рис. 4. Фрагмент сравнения выравниваний по muscle (сверху) и mafft (снизу).
Наконец, был проведен поиск доменов Pfam-семейств в исходной последовательности, с использованием сервиса Pfam. В результате поиска по исходной последовательности белка было найдено 3 совпадения, приведенных на рис. 6.
Рис. 5. Выходные данные для поиска по последовательности в Pfam.
Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.