1. Разделение выравнивания
В предыдущем задании было получено выравнивание представителей моего домена. Я разделила его на две группы, основываясь на архитектуре белков, тем самым получив два файла ali-one.msf и ali-two.msf.2. Постройка профиля, отличающего одну группу последовательностей от другой
В данном случае необходимо провести те же действия, что и в предыдущем задании, исключая этап нормализации. В итоге получила профиль для обоих частей выравнивания. Провела поиск по профилю среди последовательностей обеих групп, при этом порог веса поставила маленьким (-с 0.0), чтобы все последовательности оказались в выдаче. Была построена ROC-кривая зависимости чувствительности и специфичности находок от граничного значения веса находки.Для первой группы:
В данном случае порог веса можно установить 15.5, однако он дает 25 ошибок первого рода. (то есть числу вероятности не определить последовательнсость, содержаую домен, согласно Pfam). Также получилось 2 ошибки второго рода.
Для второй группы:
Здесь порог веса можно установить как 4.3, что дает лишь 2 ошибки первого рода и 2 ошибки второго рода.
Сравнив эти два профиля, можно предположить, что по ним возможно разделять последовательности двух групп, однако я бы не стала пользоваться первым.
Таблица с результатами