Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2023

Практикум 11. Домашнее задание

Задание обязательно для тех, кто не сделал 18 апреля задание в классе или сделал его неудовлетворительно. Те, у кого задание в классе зачтено, могут при желании сделать это задание для получения дополнительных баллов. Дедлайн (сразу жёсткий) — среда 21 мая.

  1. Выберите какое-нибудь семейство Pfam и в нём подсемейство. Критерии выбора подсемейства:
    • По доменной архитектуре (рекомендуется)
    • По таксономии
    • Как кладу на дереве, построенном по выравниванию seed
    • Ещё как-нибудь
  2. Постройте профиль HMM по последовательностям доменов (не полных белков) подсемейства. Используйте программу hmmbuild.
  3. Скачайте последовательности полных белков с доменом из выбранного семейства. Запустите поиск своим профилем (программа hmmsearch) по этим белкам.
  4. Определите оптимальный порог на вес находки, который лучше всего выделяет подсемейство на фоне семейства

В директорию ~/term4/pr11 положите файлы:

На странице с отчётом (со ссылкой со страницы семестра) напишите:


Напоминаем, что:

Сумма всех четырёх чисел должна быть равна общему числу белков в области поиска (число находок в выходном файле может оказаться меньше, так как белки с очень низким весом могут туда не попасть)

2023/4/task11 (последним исправлял пользователь sas 2025-05-08 09:31:22)