Учебная страница курса биоинформатики,
год поступления 2013
Занятие 13. Построение множественного выравнивания. Pfam
Дедлайн: 14 мая.
Критерии оценки – такие же, как в задании про PubMed.
Выполненные задания также надо записывать в очередь на проверку. Состояние очереди можно посмотреть тут.
Результат:
Проект JalView в виде единого JAR файла с четырьмя окнами
- выравнивание из п.2, выравнивание из п. 3, их сравнение (п.4)
- выравнивание из Pfam (п. 5). Названия всех этих окон должны быть небессмысленными (для этого сохраните каждое выравнивание в отдельный файл с "говорящим" названием и загрузите его).
- описание действий и результатов и ссылка на JAR на html странице
1. При помощи программ BLAST и PSI-BLAST соберите выборку из 7-8 белков, гомологичных вашему. За основу (или целиком) можно взять выборку, составленную в предыдущих заданиях.
Выбирайте белки, гомологичные почти по всей длине (coverage = 70-90%). При этом в выборке не должно быть "почти идентичных" белков - выбирайте на глаз такие белки, чтобы все ID были на уровне ID = 50-60%. При этом гомологии должны быть достоверными (E-value < 1e-5 в результатах поиска). Для поиска гомологов используйте банк SwissProt или RefSeq.
2. Постройте множественное выравнивание отобранных последовательностей при помощи программы muscle на сервере kodomo. При вызове без параметров программа отображает справочную информацию. Внесите в протокол команду, которой вы воспользовались для построения выравнивания.
3. Постройте множественное выравнивание тех же последовательностей при помощи программы mafft на сервере kodomo. Команда такая:
mafft infile.fasta > outfile.fasta
Допустимо второе выравнивание построить любой другой программой или сервисом, см. дополнительное задание. Укажите использованную команду или сервис в протоколе.
4. Сравните выравнивания, полученные в п.п.2 и 3. Два варианта действий:
Cоздайте окно в JalView, куда загрузите оба выравнивания и раскрасьте по группам. Отредактируйте эту пару выравниваний так, чтобы одни и те же блоки оказались друг под другом. (Как это делали с парными выравниваниями в задании 10.)
- Используйте программу muscle для построения выравнивания двух выравниваний. Команда такая:
muscle -profile -in1 one.afa -in2 two.afa -out both.afa
Затем откройте в JalView и покрасьте по группам.
Задача сравнения выравниваний сложна. Ожидаем, что в выравнивании двух выравниваний одних и тех же последовательностей вы отметите участки совпадения - т.е. те, на которых остатки в колонках первого выравнивания точно те же, что в колонках второго. И напишете комментарии в протоколе.
5. Домены каких Pfam-семейств встречаются в исходной последовательности? Используйте поиск по последовательности на сайте Pfam. Сохраните seed выравнивание одного из семейств.
Дополнительные задания
6.(*)Постройте множественное выравнивание тех же последовательностей при помощи одной или нескольких программ из списка ClustalOmega, ClustalW, probcons, Tcoffee. Опишите различия между выравниванием muscle и полученными
ClustalOmega доступен на сайте http://www.ebi.ac.uk/Tools/msa/clustalo/ . Обратите внимание на параметр Dealign input sequences (появляется по кнопке More options). Это самая новая программа из серии Clustal.
ClustalW реализован в программе emma пакета EMBOSS. Также доступен из JalView как веб-сервис.
Probcons и Tcoffee доступны из JalView. Конечно, есть и веб-сервисы.
7.(*)Проверьте, изменяет ли выравнивание, полученное другой программой, алгоритм оптимизации (refimnent), реализованный в muscle Команда оптимизации уже построенного выравнивания такая: muscle -in msa.afa -out refined_msa.afa -refine