Анализ результата поиска по профилю

Разделение выравнивания представителей домена на две группы.

Исходное выравнивание разделили на две группы в соответствии с разделение на архитектуры и получили два выравнивания: dom1_0.msf(двухдоменная арихитектура) и dom2_0.msf(однодоменная архитектура).

Построение профиля, отличающего одну группу последовательностей от другой

По двум выравниваниям построили два профиля: dom1_0.prf и dom2_0.prf, чтобы выбрать лучший. Профили строили без этапа нормализации.
Результаты поиска по файлу seq1.fasta были открыты в Excel и постороены score- и ROC-кривые, создана scores.xls.
Для первого профиля (однодоменная архитектура) на основании score-кривой можно предположить порог веса 8,82, построив ROC-кривую можно убедиться в правильности выбора парога, однако было допущего много ошибок первого (20) и второго (21) рода.
Score-кривая для профиля, описующего однодоменную архитектуру. ROC-кривая для профиля, описующего однодоменную архитектуру.

Для второго профиля так же были построены score- и ROC-кривые, по score-кривой определили порог (34), что подтвердилось ROC-кривой. Было допущено 32 ошибки первого рода, однако ни одной ошибки второго рода.
Score-кривая для профиля, описующего двудоменную архитектуру. ROC-кривая для профиля, описующего двудоменную архитектуру.

Сравнивая два профиля можно сразу заметить, что на профиль для однодоменной струкутры находятся еще и последовательности, содержащие двухдоменную. Это возможно если последовательности с двухдоменной архитектурой похожи на последовательности с однодоменной. Если выровнять все выбранные последовательности и раскрасить по консервативности, то нетрудно заметить, что последовательности действительно очень похожи.


© Butusova Anna,2013