Контрольная работа (3 вариант).


Построение выравнивания


Даны последовательности десяти РНК-зависимых РНК полимераз (RdRP) вирусов из pfam семейства pf00680. Для одной из них(POLG_RHDVF) известна пространственная структура Подготовила фрагмент выравнивания этих последовательностей для построения профиля всего семейства.
В выравнивании разметила консервативные участки и вторичную структуру.

Построение ROC-кривой


Провела поиск по белкам вирусов из SwissProt, взяв все находки с весом > 1
Для построения ROC-кривой использовала формулы из образца rdrp.xls в директории Term4/Block3/Pr13


Таблица с результатом.

таблица результатов предсказания принадлежности семейству.


Я взяла порог для разделения членов семейства от иных последовательностей равным 1,8. Для него справедлива таблица:
    			RdRP	Не RdRP	Всего
Предсказание RdRP	157	1	158
Предсказание не RdRP	5	104	109
Всего			162	105	267

число ошибок: 6
процент ошибок: 2.25%
всего RdRP 213 последовательностей
Чувствительность(процент правильно предсказанных среди всех RdRP): 74%
Специфичность(процент правильно не предсказанных среди не RdRP): 95%
Такой хороший результат говорит о том, что фрагмент выравнивания был выбран удачно для построения профиля. © Garanina Irina