Занятие 13. Контрольная работа.

Вариант 2.



Задание 1.

Даны последовательности десяти РНК-зависимых РНК полимераз (RdRP) вирусов из pfam семейства pf00680. Для одной из них известна пространственная структура Подготовить фрагмент выравнивания этих последовательностей для построения профиля всего семейства.

Было получено выравнивание: Результат.

Задание 2. Построение ROC-кривой

Провела поиск по белкам вирусов из SwissProt, взяв все находки с весом > 0,7

Для построения ROC-кривой использовала функции:

X(1-специфичность)=1-СЧЁТЕСЛИ(B3:B$191;"<>"&"Y")/СЧЁТЕСЛИ(B$2:B$191;"<>"&"Y")
Y(чувствительность)=СЧЁТЕСЛИ(B$2:B2;"Y")/СЧЁТЕСЛИ(B$2:B$191;"Y")

Получилась ROC-кривая:

Таблица с результатом.

Задание 3. Таблица результатов для порога 0,99.

Я взяла порог для разделения членов семейства от иных последовательностей равным 0,99. Для него справедлива таблица:

Таким образом ошибок в предсказании нет, процент правильно предсказанных среди всех RdRP 100% (чувствительность), специфичность ( процент правильно не предсказанных среди не RdRP) также равна 1.

Вывод: или участок выравнивания, выбранный для построения профиля был достаточно хорошим, или где-то есть ошибка))


© SHADRINA О. А. 2012