Занятие 10. Множественные выравнивания

 
     

 

Сравните множественное выравнивание, построенное программой ClustalW, с "эталонным" выравниванием из банка выравниваний SMART

База данных SMART содержит проверенные экспертами множественные выравнивания гомологичных белковых доменов. Выравнивания согласованы с данными о пространственной структуре (если она известна). Эти выравнивания часто используют как эталонные (benchmark alignment) при оценке качества работы новых программ выравнивания.

  1. Получите эталонное выравнивание.
  2. В базе данных SMART получите изображение доменной структуры Вашего белка. Выберите один из доменов и получите эталонное выравнивание доменов, гомологичных выбранному. Сохраните эталонное выравнивание в текстовом файле xxx.msf, где ххх — название домена или идентификатор SMART.

    Подробнее см. подсказки, п.1.
     

  3. Вырежьте из эталонного выравнивания с помощью GeneDoc фрагмент для дальнейшего детального исследования.
  4. Толщина фрагмента должна быть 5 последовательностей, ширина — 50–80 остатков. Фрагмент должен быть непрерывным (то есть включать все буквы выбранных последовательностей, заключенные между какими-нибудь началом и концом).

    Желательно, чтобы оставшиеся последовательности имели идентификаторы Swiss-Prot, различающие как по первой части, так и по второй части имени (например, RBSR_ECOLI, PURR_PASMU).

    Желательно также, чтобы фрагмент включал в себя как участки очевидно хорошего выравнивания (с большой долей консервативных позиций), так и плохо выровненные участки, примерно в соотношении 2:1.

    Сохраните фрагмент выравнивания в файле benchmark.msf.
     

  5. По идентификаторам UniProt из benchmark.msf получите с помощью SRS полные последовательности в формате Fasta.
  6. Сохраните их в файле full_seq.fasta.
     

  7. Постройте программой ClustalW множественное выравнивание последовательностей из full_seq.fasta
  8. Воспользуйтесь программой emma пакета EMBOSS (эта программа — одна из реализаций ClustalW). Импортируйте выравнивание в GeneDoc и сохраните в виде файла clustalw.msf.
     

  9. Сравните полученные выравнивания.
  10. Для того, чтобы установить соответствие между выравниваниями, сначала отметьте цветом в каждой последовательности из clustalw.msf участок, попавший в benchmark.msf (кнопки меню Shade→Manual shade).

    Проведите сравнение двух фрагментов выравнивания. Мерой сходства будем считать число совпадающих колонок, деленное на общее количество колонок в benchmark.msf.

    Если число совпадающих колонок равно 0, укажите, существует ли пара-тройка-четвёрка последовательностей, в пределах которых какие-то колонки все же совпадают.
     

  11. Экспортируйте выравнивания в HTML
  12. Экспортируйте выравнивание benchmark.msf в виде HTML-странички benchmark.html, а фрагмент выравнивания clustalw.msf, включающий выделенные участки — в виде HTML-странички clustalw.html. Вставьте полученные изображения выравниваний в отчет.
Формат отчета

Дополнительное задание

Получите матрицу попарного совпадения последовательностей. Матрицу сохраните в текстовом файле.

Подсказка. Сначала добейтесь нужной конфигурации выдачи. В меню конфигурации (кнопки Reports→Configure reports) оставьте галочки против пунктов "Show calculations for Exact matches" и "Show results as percent values". Затем получите матрицу (Reports→Statistics Report).