Практикум 8. HMM профль и ROC-кривая.

Для данного практикума был выбран домен PF00969 семейства MHC_II_beta.
database:(type:pfam id:PF00969) taxonomy:"Eutheria [9347]" AND reviewed:yes
Выданные результаты можно найт в таблице(лист SwissProt): otchet.xls
Из них выбрали первые 15 последовательностей и построили их выравнивание: 8align.fasta
( проект выравнивания )

Рисунок 1. Выраванивание отобранных последовательностей

Выравнивание покрашено с помощью ClustalX, By conservation = 30. Как видно из рис. 1 это очень консервативные участки.

Для этого выравнивания был построен и откалиброван профиль.
Используемые команды:


Затем был выполнен поиск по uniprot_sprot.fasta, где лежит БД SwissProt с помощью команды:
hmm2search -T 20 profile.out /srv/databases/emboss/data/uniprot/uniprot_sprot.fasta > search.out
Затем данные были записаны в таблицу(лист HMM), по которым была построенна гистограмма распределения весов и ROC-кривая.

Рисунок 2. Гистограмма распределения весов

Рисунок 3. ROC-кривая

Был выбран порог по весу: 410. Это значит, чтопри равно или большем весе, можно сказать, что последовательность принадлежит целевому семейству


Как мы видим, все показатели очень хорошие, что говорит о том, что профиль крайне специфичен и его можно считать достоверным. Это также можно было сказать по площади под графиком ROC-кривой. Так как она почти единица, значит по Score можно предсказать класс почти абсолютно точно. Возможно, это связано с функцией MHC_II_beta. Это главный комплекс гистосовместимости, который играет важнейшую роль в развитии иммунного ответа.


<<< Назад


Главная страница.



© Гурылева Мария Вячеславовна 2016