1. Разделение выравнивания

В предыдущем задании было получено выравнивание представителей моего домена. Я разделила его на две группы, основываясь на архитектуре белков, тем самым получив два файла ali-one.msf и ali-two.msf.

2. Постройка профиля, отличающего одну группу последовательностей от другой

В данном случае необходимо провести те же действия, что и в предыдущем задании, исключая этап нормализации. В итоге получила профиль для обоих частей выравнивания. Провела поиск по профилю среди последовательностей обеих групп, при этом порог веса поставила маленьким (-с 0.0), чтобы все последовательности оказались в выдаче. Была построена ROC-кривая зависимости чувствительности и специфичности находок от граничного значения веса находки.

Для первой группы:

В данном случае порог веса можно установить 15.5, однако он дает 25 ошибок первого рода. (то есть числу вероятности не определить последовательнсость, содержаую домен, согласно Pfam). Также получилось 2 ошибки второго рода.

Для второй группы:

Здесь порог веса можно установить как 4.3, что дает лишь 2 ошибки первого рода и 2 ошибки второго рода.

Сравнив эти два профиля, можно предположить, что по ним возможно разделять последовательности двух групп, однако я бы не стала пользоваться первым.

Таблица с результатами