Контрольная работа (3 вариант).
Построение выравнивания
Даны последовательности десяти РНК-зависимых РНК полимераз (RdRP) вирусов из pfam семейства pf00680. Для одной из них(POLG_RHDVF) известна пространственная структура
Подготовила фрагмент выравнивания этих последовательностей для построения профиля всего семейства.
В выравнивании разметила консервативные участки и вторичную структуру.
Построение ROC-кривой
Провела поиск по белкам вирусов из SwissProt, взяв все находки с весом > 1
Для построения ROC-кривой использовала формулы из образца rdrp.xls в директории Term4/Block3/Pr13
Таблица с результатом.
таблица результатов предсказания принадлежности семейству.
Я взяла порог для разделения членов семейства от иных последовательностей равным 1,8. Для него справедлива таблица:
RdRP Не RdRP Всего
Предсказание RdRP 157 1 158
Предсказание не RdRP 5 104 109
Всего 162 105 267
число ошибок: 6
процент ошибок: 2.25%
всего RdRP 213 последовательностей
Чувствительность(процент правильно предсказанных среди всех RdRP): 74%
Специфичность(процент правильно не предсказанных среди не RdRP): 95%
Такой хороший результат говорит о том, что фрагмент выравнивания был выбран удачно для построения профиля.
|
© Garanina Irina