Профили


Для построения профиля была выбраны белки архитектуры Malic_M + malic из таксона Proteobacteria из прошлого раздела.
Последовательности этих белков группируются в четко оформленную кладу на филогенетическом дереве.


Рисунок 1. Выравнивание выбранных последовательностей домена Malic_M в архитектуре с доменом malic в таксоне Proteobacteria с раскраской ClustalX.

С помощью команды hmm2build по этому выравниванию был построен профиль. Затем профиль был откалиброван программой hmm2calibrate.Полученный профиль.
Затем был получен файл, содержащий все последовательности изучаемого домена (PF0349 Malic_M). Командой hmm2search был проведен поиск профилем по этому файлу. Результат поиска. Для оценки эффективности работы профиля был составлен файл ("золотой стандарт"), содержащий ID всех последовательнсотей домена в составе данной архитектуры в этом таксоне.
При пороге e-value = 1e-10 было првоедено сравнение списка находок по профилю с золотым стандартом. Таблица сравнения. Оказалось, что были найдены все последовательности, входящие в "золотой стнадарт". Таким образом, можно определить следующие характеристики выдачи поиска по профилю: Из этих параметров в совю очередь можно определеить чувствительность и избирательность: Такми образом, видно, что построенный профиль обладает 100%-ой чувствительностью (нашлись все последовательности, входящие в "золотой стандарт"), но очень малой избирательностью (нашлось слишком много лишних последовательностей).

Главная страница Первый семестр Второй семестр Третий семестр Обо мне Ссылки


© Марк Меерсон, 2014
Последнее обовление: 28.05.2014