На страницу IV-ого семестра

Классификация функций. Коды ферментов.

  1. Объяснение кода фермента

    На сайте IUPAC заходим по ссылке 'Division'. На открывшейся странице выбираем 'VII. CHEMICAL NOMENCLATURE AND STRUCTURE REPRESENTATION'. Далее следуем по ссылке 'IUBMB-IUPAC Joint Commission on Biochemical Nomenclature (JCBN)'. Тут выбираем Enzyme Nomenclature, на этой страничке находятся описания кодов ферментов.

    Код фермента: 5.2.1.8

    EC 5. Изомеразы
    Описание: класс ферментов, катализирующих внутримолекулярные перемещения различных групп.

    EC: 5.2 цис-транс-Изомеразы
    Описание: они вызывают изменение геометрической конфигурации у двойной связи.

    EC: 5.2.1
    Описание: единственный подкласс.

    EC: 5.2.1.8 Пептидил-пролил изомеразы
    Описание: контролирует цис-транс-изомеризацию Х-Рго Ci-Ni+1 связей (X - любая аминокислота; Pro - пролин) в синтезируемом пептиде. Ускоряет реакцию, приводящую к повороту цепи на 180° вокруг Ci-Ni+1 связи.
    peptidylproline (ω=180) = peptidylproline (ω=0) (ω - угол вращения вокруг связи Ci-Ni+1, где Сi-атом углерода карбоксильной группы одного аминокислотного остатка; Ni+1-атом азота аминогруппы соседнего аминокислотного остатка; проще говоря ω - угол вращения вокруг пептидной связи, см. рис.)

    Подробнее почитать про пептидил-пролил изомеразы можно на странице IUPAC, посвещенной этому ферменту.

  2. Сравнение последовательностей ферментов с одинаковыми кодами из эволюционно далеких организмов

    C помощью SRS по коду 5.2.1.8 искали в UniProt все ферменты из 3-х хорошо изученных модельных организмов - кишечной палочки Escherichia coli K-12, археи Methanococcus jannaschii и человека. Запрос SRS:

    ((([uniprot-ID:*_human] | [uniprot-ID:*_metja]) |  [uniprot-ID:*_ecoli]) & [uniprot-ECNumber:5.2.1.8])

    Было найдено 47 документов UniProt, из которых 41 последовательность гены, которых имеют имена, в том числе 32 последовательности белков человека, и 9 последовательностей Escherichia coli K-12. Не найдено было документов UniProt содержащий номер фермента 5.2.1.8 из организма Methanococcus jannaschii (у обоих найденных последовательностей гены имен не имели!!!). Объяснение тому, что найдено так много последовательностей, видимо, заключается в том, что фермент пептидил-пролил изомераза - важный и распостраненный фермент в организме человека и кишечной палочки. Фермент участвует в фолдинге первичных транскриптов. У археи Methanococcus jannaschii этот фермент либо реже встречается, либо хуже исследован и описан в UniProt.

    Сравнение доменной структуры ферментов из далеких организмов

     
    UniProt ID
    UniProt AC
    Имя гена
    Первый домен
    Второй домен
    Идентификатор Pfam
    Положение в пос-ти
    Идентификатор Pfam
    Положение в пос-ти
    1 FKB10_HUMAN Q96AY3 FKBP10 PF00254 165-259
    277-371
    390-483
    PF00036 504-529
    546-568
    2 FKB11_HUMAN Q9NYL4 FKBP11 PF00254 48-141    
    3 FKB14_HUMAN Q9NWM8 FKBP14 PF00254 36-132 PF00036 139-167
    183-204
    4 FKB1A_HUMAN P62942 FKBP1A PF00254 10-104    
    5 FKB1B_HUMAN P68106 FKBP1B PF00254 10-104    
    6 FKBP2_HUMAN P26885 FKBP2 PF00254 40-134    
    7 FKBP3_HUMAN Q00688 FKBP3 PF00254 119-221    
    8 FKBP4_HUMAN Q02790 FKBP4 PF00254 157-249 PF00515 275-294
    318-351
    352-385
    9 FKBP5_HUMAN Q13451 FKBP5 PF00254 156-248 PF00515 317-350
    351-384
    10 FKBP6_HUMAN O75344 FKBP6 PF00254 40-140 PF07719 253-286
    11 FKBP7_HUMAN Q9Y680 FKBP7 PF00254 44-179 PF00036 186-214
    230-258
    12 FKBP8_HUMAN Q14318 FKBP8 PF00254 54-144 PF00515 215-248
    249-282
    13 FKBP9_HUMAN O95302 FKBP9 PF00254 157-251
    269-362
    380-474
    PF00036 492-520
    537-563
    14 PIN1_HUMAN Q13526 PIN1 PF00639 59-163 PF00397 7-37
    15 PIN4_HUMAN Q9Y237 PIN4 PF00639 42-129    
    16 PPIA_HUMAN P0AFL3 PPIA PF00160 30-189    
    17 PPIB_HUMAN P23284 PPIB PF00160 37-197    
    18 PPIC_HUMAN P45877 PPIC PF00160 39-199    
    19 PPID_HUMAN Q08752 PPID PF00515 222-255
    272-305
    306-339
    PF00160 16-183
    20 PPIE_HUMAN Q9UNP9 PPIE PF00076 8-79 PF00160 141-300
    21 PPIF_HUMAN P30405 PPIF PF00160 47-206    
    22 PPIG_HUMAN Q13427 PPIG PF00160 9-177    
    23 PPIH_HUMAN O43447 PPIH PF00160 12-177    
    24 PPIL1_HUMAN Q9Y3C6 PPIL1 PF00160 13-165    
    25 PPIL2_HUMAN Q13356 PPIL2 PF00160 281-434    
    26 PPIL3_HUMAN Q9H2H8 PPIL3 PF00160 2-155    
    27 PPIL4_HUMAN Q8WUA2 PPIL4 PF00076 242-313 PF00160 2-162
    28 PPIL6_HUMAN Q8IXY8 PPIL6 PF00160 143-309    
    29 PPWD1_HUMAN Q96BP3 PPWD1 PF00400 123-161
    284-308
    PF00160 493-646
    30 Q6FH57_HUMAN Q6FH57 PPIH PF00160 12-177    
    31 Q6IBH5_HUMAN Q6IBH5 PPIB PF00160 45-205    
    32 Q6M1B6_HUMAN Q6M1B6 DKFZP686GO42 PF00160 47-144    
    33 FKBB_ECOLI POA9L3 FKBB PF01346 1-107 PF00254 111-202
    34 PPIA_ECOLI POAFL3 PPIA PF00160; 30-189    
    35 PPIB_ECOLI P23869 PPIB PF00160 1-163    
    36 PPIC_ECOLI POA9L5 PPIC PF00639 8-90    
    37 PPID_ECOLI P0ADY1 PPID PF00639 274-355    
    38 FKBA_ECOLI P45523 FKPA PF01346 23-152 PF00254 156-264
    39 FKBX_ECOLI P0AEM0 FKPB PF00254 10-140    
    40 SLYD_ECOLI P0A9K9 SLYD PF00254 2-137    
    41 SURA_ECOLI P0ABZ6 SURA PF00639 178-272
    289-382
       

    У 41 найденных ферментов было обнаружено 10 различных доменов Pfam, в некоторых ферментах имеется два различных домена, также встречаются случаи, когда в одном белке встречается несколько одинаковых доменов. Достаточно сложно сравнить доменную архитектуру всех 41 ферментов, поэтому разумно остановиться на сравнение 4-х ферментов (в таблице они выделены жирным шрифтом). У них у всех есть домен PF00254 (пептидил-пролил цис-транс изомеразный домен), у человеческого белка FKBP8_HUMAN есть еще и домен PF00515 (Tetratricopeptide TPR_1). Для домена PF00254 нет характерного местоположения в аминокислотной последовательности, в 4-х разных последовательностях, он расположен в разных местах последовательности. Кроме того, домены из разных белков имеют разную длину. Можно сделать вывод, что не наблюдается общей формы устройства доменной архитектуры для 4-х выбранных нами белков.

    Ввиду того, что если строить попарное выравнивание всех 41 аминокислотных последовательностей, придется построить 820 выравниваний. Построить и проанализировать такое количество выравниваний в обозримое время не представляется возможным, поэтому выберем по 2 последовательности из кишечной палочки и человека случайным образом и исследуем их. Выбранные документы выделены жирным в таблице выше. Гомологичный домен для выбранных четырех последовательностей является PF00254 (пептидил-пролил цис-транс изомеразный домен).

    Чтобы оценить сходство аминокислотных последовательностей гомологичных доменов, получим их FASTA последовательности, а затем построим попарное выравнивание. Предварительно вырезав последовательности нужных доменов с помощью программы seqret. Был создан скрипт, который позволяет получить все результаты в одном файле.

    ########################################
    # Program: needle
    # Rundate: Tue Mar 27 2007 23:08:05
    # Commandline: needle
    #    [-asequence] fkb1a_human.fasta
    #    [-bsequence] fkbp6_human.fasta
    #    -gapopen 10
    #    -gapextend 0.5
    #    [-outfile] stdout
    # Align_format: srspair
    # Report_file: stdout
    ########################################
    
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: FKB1A_HUMAN
    # 2: FKBP6_HUMAN
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 101
    # Identity:      32/101 (31.7%)
    # Similarity:    49/101 (48.5%)
    # Gaps:          16/101 (15.8%)
    # Score: 149.0
    # 
    #
    #=======================================
    
    FKB1A_HUMAN        1 PGDGRTFPKRGQTCVVHYTGMLED-GKKFDSSRDRNKPFKFMLGKQEVIR     49
                                   ..:.:|.|:|.||. .:.|||:..|..|....||:...:.
    FKBP6_HUMAN        1 ----------DASVLVKYSGYLEHMDRPFDSNYFRKTPRLMKLGEDITLW     40
    
    FKB1A_HUMAN       50 GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVEL----     95
                         |.|.|:..|..|:.|:....|:||||..|.|.:|||:.|::|::||    
    FKBP6_HUMAN       41 GMELGLLSMRRGELARFLFKPNYAYGTLGCPPLIPPNTTVLFEIELLDFL     90
    
    FKB1A_HUMAN       95 -     95
                          
    FKBP6_HUMAN       91 D     91
    
    
    #---------------------------------------
    #---------------------------------------
    ########################################
    # Program: needle
    # Rundate: Tue Mar 27 2007 23:08:05
    # Commandline: needle
    #    [-asequence] fkb1a_human.fasta
    #    [-bsequence] fkbx_ecoli.fasta
    #    -gapopen 10
    #    -gapextend 0.5
    #    [-outfile] stdout
    # Align_format: srspair
    # Report_file: stdout
    ########################################
    
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: FKB1A_HUMAN
    # 2: FKBX_ECOLI
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 143
    # Identity:      30/143 (21.0%)
    # Similarity:    49/143 (34.3%)
    # Gaps:          60/143 (42.0%)
    # Score: 103.5
    # 
    #
    #=======================================
    
    FKB1A_HUMAN        1 PGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRG     50
                                     ..:||:|..|:||...:|:|:..||..|.||...:..|
    FKBX_ECOLI         1 ------------AVLVHFTLKLDDGTTAESTRNNGKPALFRLGDASLSEG     38
    
    FKB1A_HUMAN       51 WEEGVAQMSVGQRAKLTISPDYAYG-------------------------     75
                         .|:.:..:.||.:...::.||.|:|                         
    FKBX_ECOLI        39 LEQHLLGLKVGDKTTFSLEPDAAFGVPSPDLIQYFSRREFMDAGEPEIGA     88
    
    FKB1A_HUMAN       76 --------ATGHPGII-------------PPHA--TLVFDVEL     95
                                 .:..||:|             .|.|  |:.||:|:
    FKBX_ECOLI        89 IMLFTAMDGSEMPGVIREINGDSITVDFNHPLAGQTVHFDIEV    131
    
    
    #---------------------------------------
    #---------------------------------------
    ########################################
    # Program: needle
    # Rundate: Tue Mar 27 2007 23:08:05
    # Commandline: needle
    #    [-asequence] fkb1a_human.fasta
    #    [-bsequence] slyd_ecoli.fasta
    #    -gapopen 10
    #    -gapextend 0.5
    #    [-outfile] stdout
    # Align_format: srspair
    # Report_file: stdout
    ########################################
    
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: FKB1A_HUMAN
    # 2: SLYD_ECOLI
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 145
    # Identity:      25/145 (17.2%)
    # Similarity:    37/145 (25.5%)
    # Gaps:          59/145 (40.7%)
    # Score: 47.0
    # 
    #
    #=======================================
    
    FKB1A_HUMAN        1 PGDGRTFPKRGQTCVVH--YTGMLEDGKKFDSSRDRNKPFKFMLGKQEVI     48
                                 |..:..||.  |....|||...|.| ..:.|..::.|...:|
    SLYD_ECOLI         1 --------KVAKDLVVSLAYQVRTEDGVLVDES-PVSAPLDYLHGHGSLI     41
    
    FKB1A_HUMAN       49 RGWEEGVAQMSVGQRAKLTISPDYAYG-----------------------     75
                         .|.|..:....||.:..:.:..:.|||                       
    SLYD_ECOLI        42 SGLETALEGHEVGDKFDVAVGANDAYGQYDENLVQRVPKDVFMGVDELQV     91
    
    FKB1A_HUMAN       76 -----ATGHPGIIPPHATLVFDVEL--------------------     95
                              |....|.:|...|.|.|..:                    
    SLYD_ECOLI        92 GMRFLAETDQGPVPVEITAVEDDHVVVDGNHMLAGQNLKFNVEVV    136
    
    
    #---------------------------------------
    #---------------------------------------
    ########################################
    # Program: needle
    # Rundate: Tue Mar 27 2007 23:08:05
    # Commandline: needle
    #    [-asequence] fkbp6_human.fasta
    #    [-bsequence] fkbx_ecoli.fasta
    #    -gapopen 10
    #    -gapextend 0.5
    #    [-outfile] stdout
    # Align_format: srspair
    # Report_file: stdout
    ########################################
    
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: FKBP6_HUMAN
    # 2: FKBX_ECOLI
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 147
    # Identity:      22/147 (15.0%)
    # Similarity:    40/147 (27.2%)
    # Gaps:          72/147 (49.0%)
    # Score: 62.0
    # 
    #
    #=======================================
    
    FKBP6_HUMAN        1 DASVLVKYSGYLEHMDRPFDSNYFRKT-----PRLMKLGEDITLWGMELG     45
                           :|||.::..|:      |......|     |.|.:||:.....|:|..
    FKBX_ECOLI         1 --AVLVHFTLKLD------DGTTAESTRNNGKPALFRLGDASLSEGLEQH     42
    
    FKBP6_HUMAN       46 LLSMRRGELARFLFKPNYAYGTLGCPPLIPPNTTVLFEIELLDFLD----     91
                         ||.::.|:...|..:|:.|:|.        |:..::......:|:|    
    FKBX_ECOLI        43 LLGLKVGDKTTFSLEPDAAFGV--------PSPDLIQYFSRREFMDAGEP     84
    
    FKBP6_HUMAN       91 -----------------------------------------------     91
                                                                        
    FKBX_ECOLI        85 EIGAIMLFTAMDGSEMPGVIREINGDSITVDFNHPLAGQTVHFDIEV    131
    
    
    #---------------------------------------
    #---------------------------------------
    ########################################
    # Program: needle
    # Rundate: Tue Mar 27 2007 23:08:05
    # Commandline: needle
    #    [-asequence] fkbp6_human.fasta
    #    [-bsequence] slyd_ecoli.fasta
    #    -gapopen 10
    #    -gapextend 0.5
    #    [-outfile] stdout
    # Align_format: srspair
    # Report_file: stdout
    ########################################
    
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: FKBP6_HUMAN
    # 2: SLYD_ECOLI
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 174
    # Identity:      19/174 (10.9%)
    # Similarity:    31/174 (17.8%)
    # Gaps:         121/174 (69.5%)
    # Score: 17.5
    # 
    #
    #=======================================
    
    FKBP6_HUMAN        0 --------------------------------------------------      0
                                                                           
    SLYD_ECOLI         1 KVAKDLVVSLAYQVRTEDGVLVDESPVSAPLDYLHGHGSLISGLETALEG     50
    
    FKBP6_HUMAN        1 --------------DASVLVKYSGYLEHMDRPFDSNYFRKTPRLMKLGED     36
                                       ||     |..|        |.|..::.|:.:.:|.|
    SLYD_ECOLI        51 HEVGDKFDVAVGANDA-----YGQY--------DENLVQRVPKDVFMGVD     87
    
    FKBP6_HUMAN       37 ITLWGMELGLLSMRRGELARFLFKPNYAYGTLGCPPLIPPNTTVL-----     81
                         ....||             |||.:.:..       | :|...|.:     
    SLYD_ECOLI        88 ELQVGM-------------RFLAETDQG-------P-VPVEITAVEDDHV    116
    
    FKBP6_HUMAN       82 --------------FEIELLDFLD     91
                                       |.:|::    
    SLYD_ECOLI       117 VVDGNHMLAGQNLKFNVEVV----    136
    
    
    #---------------------------------------
    #---------------------------------------
    ########################################
    # Program: needle
    # Rundate: Tue Mar 27 2007 23:08:05
    # Commandline: needle
    #    [-asequence] fkbx_ecoli.fasta
    #    [-bsequence] slyd_ecoli.fasta
    #    -gapopen 10
    #    -gapextend 0.5
    #    [-outfile] stdout
    # Align_format: srspair
    # Report_file: stdout
    ########################################
    
    #=======================================
    #
    # Aligned_sequences: 2
    # 1: FKBX_ECOLI
    # 2: SLYD_ECOLI
    # Matrix: EBLOSUM62
    # Gap_penalty: 10.0
    # Extend_penalty: 0.5
    #
    # Length: 139
    # Identity:      42/139 (30.2%)
    # Similarity:    67/139 (48.2%)
    # Gaps:          11/139 ( 7.9%)
    # Score: 151.5
    # 
    #
    #=======================================
    
    FKBX_ECOLI         1 ------AVLVHFTLKLDDGTTAESTRNNGKPALFRLGDASLSEGLEQHLL     44
                               .|.:.:.::.:||...:.:..:. |..:..|..||..|||..|.
    SLYD_ECOLI         1 KVAKDLVVSLAYQVRTEDGVLVDESPVSA-PLDYLHGHGSLISGLETALE     49
    
    FKBX_ECOLI        45 GLKVGDKTTFSLEPDAAFGVPSPDLIQYFSRREFMDAGEPEIGAIMLFTA     94
                         |.:||||...::..:.|:|....:|:|...:..||...|.::|  |.|.|
    SLYD_ECOLI        50 GHEVGDKFDVAVGANDAYGQYDENLVQRVPKDVFMGVDELQVG--MRFLA     97
    
    FKBX_ECOLI        95 -MDGSEMPGVIREINGDSITVDFNHPLAGQTVHFDIEV-    131
                          .|...:|..|..:..|.:.||.||.||||.:.|::|| 
    SLYD_ECOLI        98 ETDQGPVPVEITAVEDDHVVVDGNHMLAGQNLKFNVEVV    136
    
    
    #---------------------------------------
    #---------------------------------------

    На основании полученных результатов была создана сводная таблица, отражающая попарное сходство доменов.

      FKB1A_HUMAN FKBP6_HUMAN FKBX_ECOLI SLYD_ECOLI
    FKB1A_HUMAN 100%      
    FKBP6_HUMAN 31.7% 100%    
    FKBX_ECOLI 21% 15% 100%  
    SLYD_ECOLI 17.2% 10.9% 30.2% 100%

    Таким образом, из таблицы видно, что последовательности гомологичных доменов имеют очень низкий процент идентичности (менее 35%). Для последовательностей из одного организма процент идентичности несколько выше, чем для различных организмов, хотя и незначительно. Все это свидетельствует о низкой консервативности последовательности домена. Возможно, высокая консервативность наблюдается в тонкой структуре последовательности, то есть в пределах нескольких аминокислот в определенном участке.
    Из полученных выше данных (выравнивание гомологичных доменов, сравнение доменной архитектуры) можно говорить о том, что для выполнения определенной функции белком его последовательность решающей роли не играет. Очевидно, намного важнее третичная структура белка и консервативность аминокислотных остатков в каталитическом центре.


© Sedliarov Vitaliy