Практикумы 9. Домены и профили


1. Выбор домена

Для выполнения данного задания я выбрала домен LAP1_C (PF05609), который содержит белки LAP1 (Lamina-associated polypeptide 1). Эти белки расположены на внутренней ядерной мембране, они задействованы в поддержании структуры ядерной оболочки и позиционировании ламин и хроматина. Они взаимодействуют и активируют торсин A, AAA+ АТФазу, локализованную в эндоплазматическом ретикулуме через перинуклеарный домен, и образуют гетерогексамерное кольцо (LAP1-Torsin)3, которое направляет торсин во внутреннюю часть ядерной мембраны.

Ниже представлены характеристики этого домена.

  • ID: LAP1_C
  • Accession: PF05609
  • Seed: 22
  • Full: 792
  • Average length: 221.2
  • Average coverage: 53
  • HMM length: 233
  • Также была выбрана следующая доменная архитектура, которая содержится в 296 белках:

    Второй домен LAP1_N (Lamina-associated polypeptide 1, N-terminal), индентификатор: PF20443.


    Были получены: файл со всеми последовательностями, содержащими доменную архитектуру и файл со всеми последовательностями из full.

    Последовательности из полученного fasta-файла были выровнены следующей командой:

    muscle -in archs_pr9.fasta -out ali_pr9.fasta

    Затем полученное выравнивание было обрещано в Jalview до границ архитектуры. На основании полученного файла производился поиск архитектуры во всех последовательностях.

    Применяя следующие команды:

    hmm2build HMM red_ali_pr9.fasta

    hmm2calibrate HMM

    hmm2search --cpu=1 HMM parfenova_full_792_pr9.fasta > search.txt

    Был получен HMM-профиль двухдоменной архитектуры длиной 623 ао и файл, содержащий находки. На их основании построены следующие графики:

    Рисунок 1. Распределение длин белков, два пика соответсуют одно- и двухдоменной архитектуре
    Рисунок 2. ROC-кривая