Учебная страница курса биоинформатики,
год поступления 2022
UNDER CONSTRUCTION
.
Словарик
Эволюционный домен - определяем согласно базе данных Pfam
[Pfam - не истина в последней инстанции; например, бывают белки, в последовательности которых Pfam не находит ни одного эволюционного домена; это не значит, что доменов нет, скорее есть, но Pfam про них ещё не знает]
Доменная архитектура - последовательность эволюционных доменов белка; вспомогательные участки в Pfam не в счёт - участки малой сложности, трансмембранные и др., изображённые бледными прямоугольничками разных оттенков
Семейство белков - множество гомологичных белков; термин требует уточнения, которое не всегда явно указано даже в статьях.
(1) Семейство белков, содержащих определённый домен - т.е. белки семейства гомологичны по домену, а остальные их части могут не быть гомологичны, например, включать разные домены. Обычно выбирают ключевой домен, например, у ферментов - каталитический.
(2) Семейство белков гомологичных по всей длине проверяется построением и анализом выравнивания.
(3) Семейство белков с одинаковой доменной архитектурой. Можно ожидать, что все белки такого семейства гомологичны по всей длине, но следует проверять это построением выравнивания и проверкой того нет ли в нем длинных (>20 а.к.о. - не мироая константа) участков, на которых не прослеживается сходства между всеми последовательностями. Если есть такие участки, то белки не гомологичны по всей длине.
(4) Подсемейство (1) Промежуточные определения семейства - по двум или нескольким ключевым гомологичным доменам.
Задание (единственное, включает несколько этапов)
Для выполнения нужно семейство белков, содержащих выбранный ранее ДОМЕН.
Цель задания - создать HMM-профиль определенного вами подсемейства. Используя это профиль, выбор подходящего порога веса и (для A.) разметку профиля - границы доменов в профиле, составить правило отнесения неизвестного белка с известной последовательностью к подсемейству (ответ: входит или не входит). Проверить хорошо ли работает правило на семействе белков содержащих ДОМЕН.
Три варианта выбора подсемейства
- Подсемейство белков, с выбранной вами двухдоменной архитектурой, в которой один из доменов - выбранный ДОМЕН.
- Подсемейство белков из определённого таксона
- Выбранное вами подсемейство в выравнивании ДОМЕНА. Подсемейство должно выделяться независимыми признаками - таксономией или мотивами, возможно, связанными с функциями.
Что использовать: пакет программ HMMER 2.3.2. или HMMER3. В презентации есть слайды с перечислением программ и примеров командной строки на kodomo. В пакетах есть программы построения HMM профиля и поиска по профилю в БД или множестве последовательностей.
выбор порога веса находки для отнесения к семейству - за вами на основе результатов поиска
Проверка профиля:" поиск по профилю по последовательностям белков семейства и сравнение результата (списка находок) - со списком белков с выбранной архитектурой согласно Pfam. См. поясения Какие данные следует предъявить для проверки: