|
|
|
Сравните множественное выравнивание, построенное программой ClustalW,
с "эталонным" выравниванием из банка выравниваний SMART
База данных SMART содержит
проверенные экспертами множественные выравнивания гомологичных белковых
доменов. Выравнивания согласованы с данными о пространственной структуре
(если она известна). Эти выравнивания часто используют как эталонные (benchmark
alignment) при оценке качества работы новых программ выравнивания.
- Получите эталонное выравнивание.
В базе данных SMART получите изображение доменной структуры Вашего
белка. Выберите один из доменов и получите эталонное выравнивание
доменов, гомологичных выбранному. Сохраните эталонное выравнивание
в текстовом файле xxx.msf, где
ххх название домена или идентификатор SMART.
Подробнее см. подсказки, п.1.
- Вырежьте из эталонного выравнивания с помощью GeneDoc фрагмент для
дальнейшего детального исследования.
Толщина фрагмента должна быть 5 последовательностей, ширина
5080 остатков. Фрагмент должен быть непрерывным
(то есть включать все буквы выбранных последовательностей,
заключенные между какими-нибудь началом и концом).
Желательно, чтобы оставшиеся последовательности имели идентификаторы
Swiss-Prot, различающие как по первой части, так и по второй части
имени (например, RBSR_ECOLI, PURR_PASMU).
Желательно также, чтобы фрагмент включал в себя как участки очевидно хорошего
выравнивания (с большой долей консервативных позиций),
так и плохо выровненные участки, примерно в соотношении 2:1.
Сохраните фрагмент выравнивания в файле
benchmark.msf.
- По идентификаторам UniProt из benchmark.msf получите с помощью
SRS
полные последовательности в формате Fasta.
Сохраните их в файле full_seq.fasta.
- Постройте программой ClustalW множественное выравнивание
последовательностей из full_seq.fasta
Воспользуйтесь программой emma пакета EMBOSS (эта программа
одна из реализаций ClustalW).
Импортируйте выравнивание в GeneDoc и сохраните в виде
файла clustalw.msf.
- Сравните полученные выравнивания.
Для того, чтобы установить соответствие между выравниваниями, сначала
отметьте цветом в каждой последовательности из
clustalw.msf участок, попавший в benchmark.msf
(кнопки меню Shade→Manual shade).
Проведите сравнение двух фрагментов выравнивания. Мерой сходства будем
считать число совпадающих колонок, деленное на общее количество колонок
в benchmark.msf.
Если число совпадающих колонок равно 0, укажите, существует ли
пара-тройка-четвёрка последовательностей, в пределах которых
какие-то колонки все же совпадают.
- Экспортируйте выравнивания в HTML
Экспортируйте выравнивание benchmark.msf в виде HTML-странички
benchmark.html, а фрагмент выравнивания
clustalw.msf, включающий выделенные участки в виде HTML-странички
clustalw.html. Вставьте полученные
изображения выравниваний в отчет.
Формат отчета
Дополнительное задание
Получите матрицу попарного
совпадения последовательностей. Матрицу сохраните в текстовом файле.
Подсказка. Сначала добейтесь нужной конфигурации выдачи. В меню
конфигурации (кнопки Reports→Configure reports) оставьте галочки
против пунктов "Show calculations for Exact matches" и "Show results as
percent values". Затем получите матрицу (Reports→Statistics Report).
| |