Учебный сайт Мухалевой Лизаветы

Построение множественного выравнивания. Pfam

       На последнем практикуме мы проходили построение множественного выравнивания. Для выполнения задания по данной теме было необходимл получить fasta-файл с 7-8 белками-гомологами своего белка (в моём случае это всё та же Zn-зависимая пептидаза из семейства М48) со следующими критериями: Coverage = 70-90%, ID = 50-60%, E-value < 1e-5. Выборка гомологов производилась с помощью сервиса PSI-BLAST, из банка Refseq. К сожалению, белков на уровне ID = 50-60% не было, поэтому я выбирала белки с ID = 30-40%

       После получения списка гомологов, нужно было построить множественные выравнивания 2-мя способами: с помощью программы muscle и c помощью программы mafft (обе на сервере Kodomo). Для построения выравнивания с помощью muscle в PUTTY была использована следующая команда: muscle -in -out . Данное выравнивание можно скачать по данной ссылке, результат представлен на рисунке 1.
Для построения выравнивания с помощью mafft команда была следующей: mafft infile.fasta > outfile.fasta. Полученное выравнивание можно скачать по данной ссылке, результат представлен на рисунке 2.

Рисунок 1. Множественное выравнивание, полученное с помощью muscle. Окраска Clustalx. Консервативность > 70%.

Рисунок 2. Множественное выравнивание, полученное с помощью mafft. Окраска Clustalx. Консервативность > 70%.

       Далее было проведено сравнение двух выравниваний. Для этого выравнивания были совмещены и выравнены друг относительно друга с помощью редактора в Jalview (стрелками). В итоге оказалось, что у выравниваний есть один довольно крупный совместный участок - на рисунке 3 выделен серым прямоугольником - с позиции № 165 по № 397 (для нового "выравнивания выравниваний"). Можно сказать, что выравнивания очень схожи, так как если посмотреть на рисунки отдельных выравниваний, можно заметить, что основным участком гомологии в обоих выравниваниях является тот же блок, что и в совмещенном выравнивании. Но всё-таки идентичными эти выравнивания не являются.

Рисунок 3. Выравнивание двух выравниваний относительно друг друга (сравнение). Окраска Clustalx. Консервативность > 70%.

       Последним обязательным заданием было определение того, домены каких Pfam-семейств встречаются в исходной последовательности. Для этого нужно было воспользоваться сервисом Pfam. В итоге для моей последовательности было найдено 1 Pfam-A совпадение и ни одного Pfam-B (выравнивание можно скачать тут). Также благодаря базе данных Pfam я узнала, что мой белок относится к роду CL0126, что является кодом для Peptidase_MA - род цинкозависимых пептидаз, содержащих HEXXH-мотив. В этот род входит 54 семейст, среди которых и семейство М48, к которому относится данная пептидаза. Скачать выравнивание этого семества можно по данной ссылке.

       Скачать итоговый проект данного практикума можно по этой ссылке.

       В качестве дополнительного задания нужно было построить выравнивание с помощью другого сервиса. Я выбрала T-Coffee. Результатом явилось выравнивание, которое можно посмотреть на рисунке 4. Как видно из рисунка, гомологичный блок сохраняется на том же месте (внутри которого есть изменения, но они незначительны). Всего в выравнивании 49 абсолютно консервативных столбцов, в то время как в выравнивании mafft - 47, в muscle - тоже 49. Исходя из этих данных, мы не можем судить, какое выравнивание более верно - их достоверность примерно на одном уровне.

Рисунок 4. Множественное выравнивание, полученное с помощью T-Coffee. Окраска Clustalx. Консервативность > 70%.

       Пакет muscle, помимо построения выравниваний, умеет также оптимизировать другие выравнивания. Для оптимизации я выбрала выравнивание, сделанное с помощью mafft. Как видно из рисунка 5, на котором изображено оптимизированное выравнивание, изменения произошли существенные - выравнивание mafft перестало быть собой, но и не стало muscle. После изменения в выравнивании стало 48 абсолютно консервативных столбцов, что больше, чем было, но опять же достоверность этого выравнивания на том же уровне, что и у других, так что нельзя принять его за единственно верное.

Рисунок 5. Оптимизированное выравнивание mafft, полученное с помощью muscle. Окраска Clustalx. Консервативность > 70%.

       Итоговый проект по дополнительным заданиям можно скачать по данной ссылке.

© Mukhaleva Elizaveta, FBB MSU, 2013
Дата последнего изменения: 17.04.2014

Valid HTML 4.01 Strict Правильный CSS!