Учебная страница курса биоинформатики,
год поступления 2011
Практикум 12
1. Разделите выравнивание представителей домена, построенное в практикуме 9, на две группы
Можно использовать следующие варианты деления:
- разделить по доменной архитектуре белков
- разделить по таксономии организмов
- разделить на основании анализа дерева
Выбор способа деления - за вами. Обоснуйте выбор способа деления.
2. Постройте профиль, отличающий одну группу последовательностей от другой
- Исходные данные: выравнивание последовательностей домена, разделенное на две группы (результат предыдущего задания)
- Используйте пакет pftools
- Постройте профиль по одной группе (по каждой из групп).
- Подготовьте выравнивание в формате MSF.
- Уберите символы возврата строки.
- Добавьте веса последовательностей в выравнивание
- Создайте профиль
- Подготовьте файл с последовательностями из обеих групп. Файл должен быть в формате *.fasta. Это файл, по которому мы осуществляем поиск.
- Этап нормализации для данной задачи можно опустить
- Проведите поиск по профилю среди последовательностей обеих групп. Порог веса поставьте маленьким (-C 0.0), чтобы все последовательности оказались в выдаче
- Постройте ROC-кривую зависимости чувствительности и специфичности находок от граничного значения веса находки. Правильные находки - те, которые принадлежат группе, по которой построен профиль.
- Опишите результат: есть ли скачек веса, позволяющий определить порог для исследуемой группы? Какие варианты порога можно предложить на основе анализа ROC-кривой? Выберите порог и опишите результат в виде таблицы 2х2. Удалось ли создать профиль, позволяющий отличить заданные группы последовательностей?