Учебный сайт Кузнецовой Марии

Главная

Первый семестр

Второй семестр

Третий семестр

Ссылки

Об авторе

Построение множественного выравнивания

Для выбора гомологов моего белка - переносчика сульфата CysZ (Q5QZI4) была использована программа Blast. Необходимыми условиями хорошей выборки были: гомология почти по всей длине (coverage = 70-90%), отсутствие "почти идентичных" белков (ID = 50-60%), достоверность гомологов (E-value < 1e-5). Для поиска гомологов использовался банк SwissProt. К сожалению, не было найдено белков с coverage < 90% и при этом ID > 50%, поэтому бралась выборка по ID = 45-60%. Выбранные гомологи представлены на рис. 1. Их последовательности вы можете скачать здесь.

Рис. 1. Выбранные для работы гомологи.

С помощью программы muscle на сервере kodomo было простроено выравнивание последовательностей, это выравнивание вы можете скачать здесь. Его фрагмент представлен на рис. 2.

Для построения выравнивания использовалась команда:
muscle -in 20tr.fasta -out 20trmuscle.fasta

Рис. 2. Фрагмент выравнивания последовательностей, сделанного с помощью программы muscle.

С помощью программы mafft на сервере kodomo было простроено второе выравнивание последовательностей, это выравнивание вы можете скачать здесь. Его фрагмент представлен на рис. 3.

Для построения выравнивания использовалась команда:
mafft 20tr.fasta > 20trmafft.fasta

Рис. 3. Фрагмент выравнивания последовательностей, сделанного с помощью программы mafft.

Далее было проведено сравнение выравниваний, сделанных с помощью muscle и mafft. Наглядный фрагмент показан на рис. 4. Прект с выравниваниями и их сравнением в формате jar можно скачать здесь.
Если на участках с малой консервативностью (например 1-47 или 500-580) выравнивания и отличаются, то на участках с высокой степенью сходства (например 270-370), выравнивания абсолютно идентичны, хотя некоторые последовательности и поменялись местами. Это объясняется тем, что последовательности очень похожи.

Рис. 4. Фрагмент сравнения выравниваний по muscle (сверху) и mafft (снизу).

Наконец, был проведен поиск доменов Pfam-семейств в исходной последовательности, с использованием сервиса Pfam. В результате поиска по исходной последовательности белка было найдено 3 совпадения, приведенных на рис. 6.

Рис. 5. Выходные данные для поиска по последовательности в Pfam.

Дата последнего обновления: 15.09.2014
Copyright © Кузнецова Мария, 2013.