На страницу четвёртого семестра
Создание паттерна по выравниванию семейства белков.
- Паттерны и профили рибосомального белка RS11_BACSU
Нашёлся только один паттерн PS00054.
- [LIVMFR]-x-[GSTACQI]-[LIVMF]-x(1,2)-[GSTALVM]-x(0,1)-[GSN]-[LIVMFY]-x-[LIVM]-x(4)-[DEN]-x-[TS]-[PS]-x-[PA]-[STCHF]-[DN]
-
Краткое описание семейства, выделяемого этим паттерном:
Рибосомный белок S11 участвует в отборе правильнаых тРНК для синтеза белка. Располагается
в большой large lobe малой рибосомальной субъдиницы.
- Этим паттерном не находятся 66 нужных белка. И 0 лишних представителей.
- Precision (true hits / (true hits + false positives)): 100.00 %
- Recall (true hits / (true hits + false negatives)): 93.29 %
- Паттерн для поиска белков подсемейства
В качестве подсемейства я выбрала порядок Bacillales.
Выборка из подсемейства Bacillales:
RS11_BACSU
RS11_STACT
RS11_BACAA
RS11_EXISA
RS11_BREBN
RS11_LISW6
RS11_OCEIH
Выборка из других бактерий:
RS11_BIFLD
RS11_LEIXX
RS11_PARUW
RS11_CYAP8
RS11_SYNP6
RS11_PROM5
RS11_BORBZ
RS11_TREDE
В позиции 23 у всех белков из моего подсемейства стоит E, а у других бактерий - E нет.
Вокруг этого участка я и решила строить паттерн.
1) Первый вариант паттерна:
[KR]-[KR]-[NHS]-[IV]-E-x-G-[IV]-[AV]-H-I-R-S
Нашлись 54 белка из 58. У этих 4 белков (RS11_GEO*) в 23 позиции не E, a D.
2) Второй вариант паттерна :
[KR]-[KR]-[NHS]-[IV]-[ED]-x-G-[IV]-[AV]-H-I-R-S
Нашёлся один лишний белок - RS11_SYMTH.
3)Третий вариант паттeрна:
[VDQ]-[KR]-[KR]-[NHS]-[IV]-[ED]-x-G-[IV]-[AV]-H-I-R
Ура! Нашлись только белки из нужного подсемейства.
Выравнивание в формате msf
© Медведева