Анализ результатов поиска по профилю
Разделение выравнивания представителей домена на две группы.
Исходное выравнивание разделили на две группы в
соответствии с разделение на архитектуры и получили два выравнивания:dom1_0.msf(двухдоменная
арихитектура) и dom2_0.msf(однодоменная
архитектура).
Построение профиля, отличающего одну группу последовательностей от другой
По двум выравниваниям построили два профиля: dom1_0.prf и dom2_0.prf,
чтобы выбрать лучший. Профили строили без этапа нормализации.
Результаты поиска по файлу seq1.fasta были
открыты в Excel и постороены score- и ROC-кривые, создана scores.xls.
Для первого профиля (однодоменная архитектура) на основании score-кривой можно
предположить порог веса 8,82, построив ROC-кривую можно убедиться в правильности
выбора парога, однако было допущего много ошибок первого (20) и второго (21)
рода.
 |
 |
Score-кривая для профиля,
описующего однодоменную архитектуру. |
ROC-кривая для профиля,
описующего однодоменную архитектуру. |
Для второго профиля так же были построены score- и ROC-кривые, по score-кривой
определили порог (34), что подтвердилось ROC-кривой. Было допущено 32 ошибки
первого рода, однако ни одной ошибки второго рода.
 |
 |
Score-кривая для профиля,
описующего двудоменную архитектуру. |
ROC-кривая для профиля,
описующего двудоменную архитектуру. |
Сравнивая два профиля можно сразу заметить, что на профиль для однодоменной
струкутры находятся еще и последовательности, содержащие двухдоменную. Это
возможно если последовательности с двухдоменной архитектурой похожи на
последовательности с однодоменной. Если выровнять все выбранные
последовательности и раскрасить по консервативности, то нетрудно заметить, что
последовательности действительно очень похожи.
©Melnichuk Anastasia