Занятие 10. Эволюция доменной архитектуры.

Задание 1. Описание выбранного домена: HEPN domain

AC PF05168
ID HEPN domain
Функция HEPN domain найден у высших эукариотов в шеперонинах, участвующих в нейродегенеративных заболеваниях. Также найден во многих бактериях в белках, отвечающих за устойчивость к антибиотикам.
Число доменных архитектур 14
Число PDB структур 9
Число белков 959
В Pfam Ссылка

Представленность домена PF05168 по таксонам

Таксон
Количество видов.
Эукариоты 13
Археи 67
Бактерии 305

Проект для выбранного домена.

Задание 2.

Первая выбранная архитектура состоит из одного моего домена.

Вторая состоит из NTP_transf_2 и HEPN доменов

Для первой архитектуры выбраны Археи, бактерии и эукариоты. Для второй отделы бактерий Bacteroidetes и Proteobacteria.

Таблица с таксономией

Проект для выборки

Деревья и профили

Дерево строились по алгоритму neibor-Joining, не укоренено и без учета молекулярных часов, так как у бактерий и архей за единицу времени сменяется больше поколений, чем у эукариот.

Белки с 2-хдоменной и с однодоменной архтектурой разделились достаточно чётко. Сильнее выделилась архитектура у Bacteroidetes, Proteobacteria отличается от однодоменной слабее. Возможно, у Bacteroidetes своя доменная архитектура, где важны оба домена. А двухдоменная архитектура у Proteobacteria эволюционировала отдельно.

В однодоменнная структуре нет разделения веток по таксонам.

Для профилей были выбраны Bacteroidetes и остальные.

Профиль по Bacteroidetes получился куда лучше, чем профиль по остальным, который также определял всегда и Bacteroidetes.

Ошибки при поиске по профилю Bacteroidetes

TP=10 FP=0
FN=0 TN=31

График зависимости ошибок от порогового значения

Ошибки при поиске по профилю из остальных белков выборки

TP=31 FP=10
FN=0 TN=0

График зависимости ошибок от порогового значения

Первый профиль. При поиске по swissprot с выбранным оптимальным пороговым значением 32.0 не было получено ни одной последовательности. Постепенно снижая порог, я получала результат при 3.0. Получены 48 последовательностей, но все без моего домена. Видимо, последовательностей с моим доменом в банке нет.

Второй профиль. При поиске по swissprot было получено 107994 белка, среди которых большинство не имело нужного домена - очевидно, профиль неудачен.

На главную


©Tsepkova Polina