Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2022

UNDER CONSTRUCTION

https://kodomo.fbb.msu.ru/FBB/year_18/images/construction1.png.

Словарик

Эволюционный домен - определяем согласно базе данных Pfam

[Pfam - не истина в последней инстанции; например, бывают белки, в последовательности которых Pfam не находит ни одного эволюционного домена; это не значит, что доменов нет, скорее есть, но Pfam про них ещё не знает]

Доменная архитектура - последовательность эволюционных доменов белка; вспомогательные участки в Pfam не в счёт - участки малой сложности, трансмембранные и др., изображённые бледными прямоугольничками разных оттенков

Семейство белков - множество гомологичных белков; термин требует уточнения, которое не всегда явно указано даже в статьях.

(1) Семейство белков, содержащих определённый домен - т.е. белки семейства гомологичны по домену, а остальные их части могут не быть гомологичны, например, включать разные домены. Обычно выбирают ключевой домен, например, у ферментов - каталитический.

(2) Семейство белков гомологичных по всей длине проверяется построением и анализом выравнивания.

(3) Семейство белков с одинаковой доменной архитектурой. Можно ожидать, что все белки такого семейства гомологичны по всей длине, но следует проверять это построением выравнивания и проверкой того нет ли в нем длинных (>20 а.к.о. - не мироая константа) участков, на которых не прослеживается сходства между всеми последовательностями. Если есть такие участки, то белки не гомологичны по всей длине.

(4) Подсемейство (1) Промежуточные определения семейства - по двум или нескольким ключевым гомологичным доменам.

Задание (единственное, включает несколько этапов)

Для выполнения нужно семейство белков, содержащих выбранный ранее ДОМЕН.

Цель задания - создать HMM-профиль определенного вами подсемейства. Используя это профиль, выбор подходящего порога веса и (для A.) разметку профиля - границы доменов в профиле, составить правило отнесения неизвестного белка с известной последовательностью к подсемейству (ответ: входит или не входит). Проверить хорошо ли работает правило на семействе белков содержащих ДОМЕН.

Три варианта выбора подсемейства

  1. Подсемейство белков, с выбранной вами двухдоменной архитектурой, в которой один из доменов - выбранный ДОМЕН.
  2. Подсемейство белков из определённого таксона
  3. Выбранное вами подсемейство в выравнивании ДОМЕНА. Подсемейство должно выделяться независимыми признаками - таксономией или мотивами, возможно, связанными с функциями.

Что использовать: пакет программ HMMER 2.3.2. или HMMER3. В презентации есть слайды с перечислением программ и примеров командной строки на kodomo. В пакетах есть программы построения HMM профиля и поиска по профилю в БД или множестве последовательностей.

выбор порога веса находки для отнесения к семейству - за вами на основе результатов поиска

Проверка профиля:" поиск по профилю по последовательностям белков семейства и сравнение результата (списка находок) - со списком белков с выбранной архитектурой согласно Pfam.

См. поясения

Какие данные следует предъявить для проверки:

2022/4/task11 (последним исправлял пользователь aba 2024-05-03 01:23:55)