На страницу четвёртого семестра

Создание паттерна по выравниванию семейства белков.

  1. Паттерны и профили рибосомального белка RS11_BACSU
    • Нашёлся только один паттерн PS00054.
    • [LIVMFR]-x-[GSTACQI]-[LIVMF]-x(1,2)-[GSTALVM]-x(0,1)-[GSN]-[LIVMFY]-x-[LIVM]-x(4)-[DEN]-x-[TS]-[PS]-x-[PA]-[STCHF]-[DN]
    • Краткое описание семейства, выделяемого этим паттерном:
      Рибосомный белок S11 участвует в отборе правильнаых тРНК для синтеза белка. Располагается в большой large lobe малой рибосомальной субъдиницы.
    • Этим паттерном не находятся 66 нужных белка. И 0 лишних представителей.
    • Precision (true hits / (true hits + false positives)): 100.00 %
    • Recall (true hits / (true hits + false negatives)): 93.29 %


  2. Паттерн для поиска белков подсемейства

  3. В качестве подсемейства я выбрала порядок Bacillales.
    Выборка из подсемейства Bacillales:
    RS11_BACSU
    RS11_STACT
    RS11_BACAA
    RS11_EXISA
    RS11_BREBN
    RS11_LISW6
    RS11_OCEIH

    Выборка из других бактерий:
    RS11_BIFLD
    RS11_LEIXX
    RS11_PARUW
    RS11_CYAP8
    RS11_SYNP6
    RS11_PROM5
    RS11_BORBZ
    RS11_TREDE


    В позиции 23 у всех белков из моего подсемейства стоит E, а у других бактерий - E нет. Вокруг этого участка я и решила строить паттерн.
    1) Первый вариант паттерна:
    [KR]-[KR]-[NHS]-[IV]-E-x-G-[IV]-[AV]-H-I-R-S
    Нашлись 54 белка из 58. У этих 4 белков (RS11_GEO*) в 23 позиции не E, a D.

    2) Второй вариант паттерна :
    [KR]-[KR]-[NHS]-[IV]-[ED]-x-G-[IV]-[AV]-H-I-R-S
    Нашёлся один лишний белок - RS11_SYMTH.

    3)Третий вариант паттeрна:
    [VDQ]-[KR]-[KR]-[NHS]-[IV]-[ED]-x-G-[IV]-[AV]-H-I-R
    Ура! Нашлись только белки из нужного подсемейства.

    Выравнивание в формате msf
    © Медведева