Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2013

Занятие 13. Построение множественного выравнивания. Pfam

Дедлайн: 14 мая.

Критерии оценки – такие же, как в задании про PubMed.

Результат:

1. При помощи программ BLAST и PSI-BLAST соберите выборку из 7-8 белков, гомологичных вашему. За основу (или целиком) можно взять выборку, составленную в предыдущих заданиях.

Выбирайте белки, гомологичные почти по всей длине (coverage = 70-90%). При этом в выборке не должно быть "почти идентичных" белков - выбирайте на глаз такие белки, чтобы все ID были на уровне ID = 50-60%. При этом гомологии должны быть достоверными (E-value < 1e-5 в результатах поиска). Для поиска гомологов используйте банк SwissProt или RefSeq.

2. Постройте множественное выравнивание отобранных последовательностей при помощи программы muscle на сервере kodomo. При вызове без параметров программа отображает справочную информацию. Внесите в протокол команду, которой вы воспользовались для построения выравнивания.

3. Постройте множественное выравнивание тех же последовательностей при помощи программы mafft на сервере kodomo. Команда такая:

mafft infile.fasta > outfile.fasta

Допустимо второе выравнивание построить любой другой программой или сервисом, см. дополнительное задание. Укажите использованную команду или сервис в протоколе.

4. Сравните выравнивания, полученные в п.п.2 и 3. Два варианта действий:

muscle -profile -in1 one.afa -in2 two.afa -out both.afa

Затем откройте в JalView и покрасьте по группам.

Задача сравнения выравниваний сложна. Ожидаем, что в выравнивании двух выравниваний одних и тех же последовательностей вы отметите участки совпадения - т.е. те, на которых остатки в колонках первого выравнивания точно те же, что в колонках второго. И напишете комментарии в протоколе.

5. Домены каких Pfam-семейств встречаются в исходной последовательности? Используйте поиск по последовательности на сайте Pfam. Сохраните seed выравнивание одного из семейств.

Дополнительные задания

6.(*)Постройте множественное выравнивание тех же последовательностей при помощи одной или нескольких программ из списка ClustalOmega, ClustalW, probcons, Tcoffee. Опишите различия между выравниванием muscle и полученными

ClustalOmega доступен на сайте http://www.ebi.ac.uk/Tools/msa/clustalo/ . Обратите внимание на параметр Dealign input sequences (появляется по кнопке More options). Это самая новая программа из серии Clustal.

ClustalW реализован в программе emma пакета EMBOSS. Также доступен из JalView как веб-сервис.

Probcons и Tcoffee доступны из JalView. Конечно, есть и веб-сервисы.

7.(*)Проверьте, изменяет ли выравнивание, полученное другой программой, алгоритм оптимизации (refimnent), реализованный в muscle Команда оптимизации уже построенного выравнивания такая: muscle -in msa.afa -out refined_msa.afa -refine