Домены и профили


Поиск домена

Я выбрала домен Zinc finger.
Доменная архитектура A0A6A4KFR9_APOLU, встречается в 148 записях.

Дальше я посмотрела на распределение длины белков, содержащих эту архитектуру. Диаграмма приведена ниже, по ней можно сказать, что длина большинства белков колеблется в пределах 300-1000.

50 последовательностей, длина которых попадает в интервал средних, были отобраны, загружены в JalView и выровнены.
Конечный результат


HMM-профиль

Я использовала следующие команды:
hmm2build -g pr9out.hmm
hmm2calibrate muscle11.fasta
Полученный результат

Затем в UniProt я скачала последовательности, содержащие домен PF00569 (26378 штук). Они представлены в файле.
При помощи команды hmm2search --cpu=1 -E 0.1 pr9out.hmm PF00569.fasta > hmm.txt была проведена проверка HMM профиля:
Результат.
Обнаружено 6625 находок с e-value ниже 0.1.



Распределение весов находок

Пороговое значение находится в точке резкого скачка вниз, этой точке соответствует e-value 6.00е-08.


Кривая ROC