Учебная страница курса биоинформатики,
год поступления 2022
В ПРОЦЕССЕ ПОПОЛНЕНИЯ
Pfam enrties classification
Family |
A collection of related protein regions |
Domain |
A structural unit |
Repeat |
A short unit which is unstable in isolation but forms a stable structure when multiple copies are present |
Motifs |
A short unit found outside globular domains |
Coiled-Coil |
Regions that predominantly contain coiled-coil motifs, regions that typically contain alpha-helices that are coiled together in bundles of 2-7 |
Disordered |
Regions that are conserved, yet are either shown or predicted to contain bias sequence composition and/or are intrinsically disordered (non-globular) |
Pfam alignments
seed |
выравнивание семейства гомологичных фрагментов из разных белков, составленное экспертом для построения модели |
full |
выравнивание всех представителей семейства, хронящихся в Pfam |
В Pfam хранятся также выравнивания фрагментов из представителей полных протеомов RP15, ..., RP75. Число в имени - это процент прореживания протеомов. 15% значит что в выборке нет протеомов со сходством более 15%.
Pfam models
Модель семейства строится по выравниванию seed. Она представляет из себя математическое описание выравнивания по колонкам. По модели можно искать гомологичные участки так же, как BLASP ищет участки сходства со входной последовательностью в Uniprot.
В Pfam используются модели, основанные на скрытых марковских цепях (HMM). Поэтому модели Pfam называют также HMM-профилями.
Pfam clans
Related Pfam entries are grouped together into clans; the relationship may be defined by similarity of sequence, structure or profile-HMM
Protein domain architecture
Доменная архитектура белка - это последовательность доменов в белке от N-конца к C-концу