Второй семестр

Работа с программой PSI-BLAST

  • Поиск гомологов белка LGB1_LUPLU ( P02239) в БД SwissProt.
  • Установленные параметры поиска:

    Результаты поиска. Параметры лучших находок.

      Кол-во E-value лучшей находки Название лучшей находки (ID ) % идентичности Длина выравнивания
    Всего находок  117  5e-82  LGB1_LUPLU  100%  154
    В бактериях (Bacteria)  36  1e-06  HMP_RHIME  29%  117
    В Escherichia coli K-12  0  -  -  -  -
    В животных (Metazoa)  26  2e-06  NGB_BRARE  25%  141
    В человеке  3  5.8  CRNL1_HUMAN  28%  78

    Гомологи в кишечной палочке не были найдены, но были обнаружены три кандидата в гомологи среди белков человека

  • Поиск гомологов LGB1_LUPLU(P02239) в БД SwissProt с помощью программы PSI-BLAST.
  • Установлнные параметры поиска:

    Результаты поиска.

    Номер итерации
    Бактерии
    Животные
    Характеристика лучшей находки среди белков
    Escherichia coli, K-12
    Homo sapiens sapiens
    Кол-во
    Новые
    Кол-во
    Новые
    Название
    E-value
    % идентичности
    Длина выравнивания
    Название
    E-value
    % идентичности
    Длина выравнивания
    1
    21 + 5 + - CRNL1_HUMAN >5.8 28% 78
    2
    38 + 332 + HMP_ECO57 10-29 20% 148 NGB_HUMAN 2*10-19 21% 143
    3
    38 - 878 + HMP_ECO57 7*10-28 20% 148 HBG2_HUMAN 4*10-45 18% 150
    4
    38 - 884 + HMP_ECO57 7*10-28 20% 148 HBG1_HUMAN 3*10-53 17% 154
    5
    38 - 884 - HMP_ECO57 7*10-28 20% 148 HBG1_HUMAN 3*10-53 17% 154

    Последовательность CRNL1_HUMAN выделена красным, т.к. ее E-value выше, чем 0,005.

    1. Psi-Blast используют для поиска далёких гомологов белков. Начиная со второй итерации, поиск осуществляется с использованием профиля PSSM, который составлен по результату множественному выравниванию ранее найденных последовательностей.
    2. Первая итерация аналогична действиям BLASTp.
    3. В результате упражнения №2 были найдены гомологи данного белка. Причем были обнаружены далёкие гомологи из различных таксонов. Были найдены гомологи из кишечной палочки, которые не были выявлены при поиске в BLASTp, а, следовательно, и при первой итерации. Для данного белка LGB1_LUPLU и белков, которые находит программа PSI-BLAST характерно связывание с кислородом.
    4. На всех итерациях, кроме последней изменялись E-value, процент идентичности, присутствие в выботке новых гомологов. Менялась лучшая находка и число находок. После каждой новой итерации меняется количество найденных белков, значит изменяется и профиль, это приводит к изменению результатов последующей итерации.
    5. Возможны 2 стратегии. Первая состоит в том, чтобы на каждой итерации вести поиск по всем организмам. Вторая состоит в том, чтобы после первой итерации отфильтровать находки по интересному для Вас таксону, и затем запустить следующие итерации. Какие отличия можно ожидать в результатах?
      При отфильтровании находок по выбраному таксону создается определенный профиль. Этот профиль учитывает характерные особенности для гомологичных белков этого таксона. Отличия будут заключаться в том, что в выборке, полученной на основе этого профиля,будут белки с особенностями, характерными для выбранного таксона. В выборке без фильтрации многие из "далеких" гомологов могут быть не обнаружены.
    6. Определите, какие остатки контактируют с гемом в "лучших находках" среди белков человека (см. поле особенностей документов UniProt). Проверьте, сохраняются ли эти аминокислотные остатки в LGB1_LUPLU, а также в "лучшей" находке среди белков кишечной палочки. Сделайте выводы из полученных результатов.
      Результаты поиска:
      1. HBG2_HUMAN: His63 и His92
      2. HBG1_HUMAN: His63 и His92
      3. NGB_HUMAN: His64 и His96
      4. CRNL1_HUMAN - с гемом не взаимодействует
      5. LGB1_LUPLU: His63 и His97
      6. HMP_ECOLI: His85
      Как видно из этих данных, вне зависимости от таксона у всех за связывание с гемом ответственен гистидин. Лучшая находка среди белков человека не взаимодействует с гемом. Множественное выравниваие:
                                                                                                                                                                                                         
                                                  *                 2 0                   *                 4 0                   *                 6 0                   *                 8            
      H B G 2 _ H U M A N   :   - - G H F T E E D K A T I T S L W G K V N V E D A G G E T L G R L L V V Y P W T Q R F F D S F G - - N L S S A S A I M G N P K V K A H G K K V L T S L G D A I   :     7 5
      H B G 1 _ H U M A N   :   - - G H F T E E D K A T I T S L W G K V N V E D A G G E T L G R L L V V Y P W T Q R F F D S F G - - N L S S A S A I M G N P K V K A H G K K V L T S L G D A I   :     7 5
      N G B _ H U M A N     :   - - M E R P E P E L I R Q S W R A V S R S P L E H G T V L F A R L F A L E P D L L P L F Q Y N C R - Q F S S P E D C L S S P E F L D H I R K V M L V I D A A V   :     7 6
      L G B 1 _ L U P L U   :   G V L T D V Q V A L V K S S F E E F N A N I P K N T H R F F T L V L E I A P G A K D L F S F L K - - - - G S S E V P Q N N P D L Q A H A G K V F K L T Y E A A   :     7 5
      H M P _ E C O L I     :   - M L D A Q T I A T V K A T I P L L V E T G P K L T A H F Y D R M F T H N P E L K E I F N M S N Q R N G D Q R E A L F N A I A A Y A S N I E N L P A L L P A V   :     7 8
                                                          3                                   r 6         P           F                   s               p       a h     k v             A              
                                                                                                                                                                                                         
                                0                   *               1 0 0                   *               1 2 0                   *               1 4 0                   *               1            
      H B G 2 _ H U M A N   :   K H L D D - - L K G T F A Q L S E L H C D K - - L H V D P E N F K L L G N V L V T V L A I H F G K E F T P E V Q A S W Q K M V T G V A S A L S S R Y H - - - -   :   1 4 6
      H B G 1 _ H U M A N   :   K H L D D - - L K G T F A Q L S E L H C D K - - L H V D P E N F K L L G N V L V T V L A I H F G K E F T P E V Q A S W Q K M V T A V A S A L S S R Y H - - - -   :   1 4 6
      N G B _ H U M A N     :   T N V E D - - L S S L E E Y L A S L G R K H R A V G V K L S S F S T V G E S L L Y M L E K C L G P A F T P A T R A A W S Q L Y G A V V Q A M S R G W D G E - -   :   1 5 1
      L G B 1 _ L U P L U   :   I Q L Q V N G A V A S D A T L K S L G S V H V S K G V V D A H F P V V K E A I L K T I K E V V G D K W S E E L N T A W T I A Y D E L A I I I K K E M K D A A -   :   1 5 3
      H M P _ E C O L I     :   E K I A Q K H T S F Q I K P E Q Y N I V G E H L L A T L D E M F S P G Q E V L D A W G K A Y G V L A N V F I N R E A E I Y N E N A S K A G G W E G T R D F R I   :   1 5 7
                                    6                       l     l                 v         F             6                 g                     w                                                    
                                                                                                                                                                                                         
                                6 0                   *               1 8 0                   *               2 0 0                   *               2 2 0                   *                          
      H B G 2 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      H B G 1 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      N G B _ H U M A N     :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      L G B 1 _ L U P L U   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      H M P _ E C O L I     :   V A K T P R S A L I T S F E L E P V D G G A V A E Y R P G Q Y L G V W L K P E G F P H Q E I R Q Y S L T R K P D G K G Y R I A V K R E E G G Q V S N W L H N H   :   2 3 6
                                                                                                                                                                                                         
                                                                                                                                                                                                         
                                2 4 0                   *               2 6 0                   *               2 8 0                   *               3 0 0                   *                        
      H B G 2 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      H B G 1 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      N G B _ H U M A N     :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      L G B 1 _ L U P L U   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      H M P _ E C O L I     :   A N V G D V V K L V A P A G D F F M A V A D D T P V T L I S A G V G Q T P M L A M L D T L A K A G H T A Q V N W F H A A E N G D V H A F A D E V K E L G Q S L   :   3 1 5
                                                                                                                                                                                                         
                                                                                                                                                                                                         
                                  3 2 0                   *               3 4 0                   *               3 6 0                   *               3 8 0                   *                      
      H B G 2 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      H B G 1 _ H U M A N   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      N G B _ H U M A N     :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      L G B 1 _ L U P L U   :   - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - - -   :       -
      H M P _ E C O L I     :   P R F T A H T W Y R Q P S E A D R A K G Q F D S E G L M D L S K L E G A F S D P T M Q F Y L C G P V G F M Q F T A K Q L V D L G V K Q E N I H Y E C F G P H K   :   3 9 4
                                                                                                                                                                                                         
                                               
                                               
      H B G 2 _ H U M A N   :   - -   :       -
      H B G 1 _ H U M A N   :   - -   :       -
      N G B _ H U M A N     :   - -   :       -
      L G B 1 _ L U P L U   :   - -   :       -
      H M P _ E C O L I     :   V L   :   3 9 6
                                               

      Во всех белках за контакт с гемом осуществляется через гистидины. По данным выравнивания можно сделать вывод, что данные позиции консервативны для 4 белков из пяти исследуемых (HBG2_HUMAN, HBG1_HUMAN, NGB_HUMAN, LGB1_LUPLU). Ситуация с HMP_ECOLI более сложна и требует долнейшего исследования.

    7. Сохраните файл с профилем PSSM. Объясните, что в нем написано, как это можно использовать.
      Возьмем для примера 5-ую итерацию, т.к. в ней не появляются новые находки (ее матрица в 16-ричном коде) . PSI-BLAST создает матрицу профиля (Position Specific Score Matrix). Она используется для расширения поиска для получения конкретной выборки белков. Общее число строк равно 154, число столбцов - 21 (20 столбцов соответствует 20 аминокислот, 21ый столбик - штраф за вставку/ делецию).


    ©Nechay Olesya 2005