Профили (пакет HMMER)

Построения профиля

В качестве выборки, по которой будет строиться профиль, были выбраны последовательности, содержащие домен EF-hand_4 в архитектуре EF-hand_4+Dynamin и принадлежащие к подтаксону Viridiplantae. Для построения профиля выбраны именно эти последовательности, так как они хорошо группируются на филогенетическом дереве, образуя единую кладу (см. практикум Эволюционные домены). Последовательности доменов приведены в файле Выборка для профиля.

Рисунок 1. Выравнивание доменов EF-hand_4 из последовательностей архитектуры EF-hand_4+Dynamin подтаксона Viridiplantae

По полученному выравниванию построен HMM (Hidden Markov Model)-профиль с помощью программы hmm2build, затем он был откалиброван командой hmm2calibrate. Полученный профиль: ПРОФИЛЬ.

Проверка построенного профиля

С помощью команды hmm2search был проведён поиск по полученному профилю. В качестве документа, где производился поиск, использовался файл в FASTA-формате со всеми последовательностями белков из Uniprot, содержащих рассматриваемый домен. Выдача программы была перенаправлена в файл: Результаты_поиска.

Теперь проанализируем полученные результаты. Из выдачи программы составим список из идентификаторов последовательностей белков и полученных для данной последовательности значений E-value: Список_результаты_поиска. C полученным списком будем сравнивать список из всех идентификаторов последовательностей из Viridiplantae с данной архитектурой: Список_сравнения. Для рассмотрения выбран порог E-value, равный 1e-8, рассматривались находки только с меньшим E-value. Из 107 белков, входящих в "золотой стандарт", было обнаружено 51 (в пределах рассматриваемого E-value), всего же белков, найденных в пределах такого E-value, 515. Таблица приведена по ссылке: Таблица.
По этим значениям были подсчитаны значения R=TP/(TP+FN)=0,47 и PPV=TP/(TP+FP)=0,099. Таким образом можно сделать вывод, что профиль HMM работает неудовлетворительно. Избирательность крайне мала, чувствительность тоже невысока (около половины).

Дата последнего обновления: 23.05.2014
© Dmitry Travin, 2014