На страницу IV-ого семестра
На сайте IUPAC заходим по ссылке 'Division'. На открывшейся странице выбираем 'VII. CHEMICAL NOMENCLATURE AND STRUCTURE REPRESENTATION'. Далее следуем по ссылке 'IUBMB-IUPAC Joint Commission on Biochemical Nomenclature (JCBN)'. Тут выбираем Enzyme Nomenclature, на этой страничке находятся описания кодов ферментов.
Код фермента: 5.2.1.8
EC 5. Изомеразы
Описание: класс ферментов, катализирующих внутримолекулярные перемещения различных групп.
EC: 5.2 цис-транс-Изомеразы
Описание: они вызывают изменение геометрической конфигурации у двойной связи.
EC: 5.2.1
Описание: единственный подкласс.
EC: 5.2.1.8 Пептидил-пролил изомеразы
Описание: контролирует цис-транс-изомеризацию Х-Рго Ci-Ni+1 связей (X - любая аминокислота; Pro - пролин) в синтезируемом пептиде. Ускоряет реакцию, приводящую к повороту цепи на 180° вокруг Ci-Ni+1 связи.
peptidylproline (ω=180) = peptidylproline (ω=0) (ω - угол вращения вокруг связи Ci-Ni+1, где Сi-атом углерода карбоксильной группы одного аминокислотного остатка; Ni+1-атом азота аминогруппы соседнего аминокислотного остатка; проще говоря ω - угол вращения вокруг пептидной связи, см. рис.)
Подробнее почитать про пептидил-пролил изомеразы можно на странице IUPAC, посвещенной этому ферменту.
C помощью SRS по коду 5.2.1.8 искали в UniProt все ферменты из 3-х хорошо изученных модельных организмов - кишечной палочки Escherichia coli K-12, археи Methanococcus jannaschii и человека. Запрос SRS:
((([uniprot-ID:*_human] | [uniprot-ID:*_metja]) | [uniprot-ID:*_ecoli]) & [uniprot-ECNumber:5.2.1.8])
Было найдено 47 документов UniProt, из которых 41 последовательность гены, которых имеют имена, в том числе 32 последовательности белков человека, и 9 последовательностей Escherichia coli K-12. Не найдено было документов UniProt содержащий номер фермента 5.2.1.8 из организма Methanococcus jannaschii (у обоих найденных последовательностей гены имен не имели!!!). Объяснение тому, что найдено так много последовательностей, видимо, заключается в том, что фермент пептидил-пролил изомераза - важный и распостраненный фермент в организме человека и кишечной палочки. Фермент участвует в фолдинге первичных транскриптов. У археи Methanococcus jannaschii этот фермент либо реже встречается, либо хуже исследован и описан в UniProt.
Сравнение доменной структуры ферментов из далеких организмов
UniProt ID |
UniProt AC |
Имя гена |
Первый домен |
Второй домен |
|||
Идентификатор Pfam |
Положение в пос-ти |
Идентификатор Pfam |
Положение в пос-ти |
||||
| 1 | FKB10_HUMAN | Q96AY3 | FKBP10 | PF00254 | 165-259 277-371 390-483 |
PF00036 | 504-529 546-568 |
| 2 | FKB11_HUMAN | Q9NYL4 | FKBP11 | PF00254 | 48-141 | ||
| 3 | FKB14_HUMAN | Q9NWM8 | FKBP14 | PF00254 | 36-132 | PF00036 | 139-167 183-204 |
| 4 | FKB1A_HUMAN | P62942 | FKBP1A | PF00254 | 10-104 | ||
| 5 | FKB1B_HUMAN | P68106 | FKBP1B | PF00254 | 10-104 | ||
| 6 | FKBP2_HUMAN | P26885 | FKBP2 | PF00254 | 40-134 | ||
| 7 | FKBP3_HUMAN | Q00688 | FKBP3 | PF00254 | 119-221 | ||
| 8 | FKBP4_HUMAN | Q02790 | FKBP4 | PF00254 | 157-249 | PF00515 | 275-294 318-351 352-385 |
| 9 | FKBP5_HUMAN | Q13451 | FKBP5 | PF00254 | 156-248 | PF00515 | 317-350 351-384 |
| 10 | FKBP6_HUMAN | O75344 | FKBP6 | PF00254 | 40-140 | PF07719 | 253-286 |
| 11 | FKBP7_HUMAN | Q9Y680 | FKBP7 | PF00254 | 44-179 | PF00036 | 186-214 230-258 |
| 12 | FKBP8_HUMAN | Q14318 | FKBP8 | PF00254 | 54-144 | PF00515 | 215-248 249-282 |
| 13 | FKBP9_HUMAN | O95302 | FKBP9 | PF00254 | 157-251 269-362 380-474 |
PF00036 | 492-520 537-563 |
| 14 | PIN1_HUMAN | Q13526 | PIN1 | PF00639 | 59-163 | PF00397 | 7-37 |
| 15 | PIN4_HUMAN | Q9Y237 | PIN4 | PF00639 | 42-129 | ||
| 16 | PPIA_HUMAN | P0AFL3 | PPIA | PF00160 | 30-189 | ||
| 17 | PPIB_HUMAN | P23284 | PPIB | PF00160 | 37-197 | ||
| 18 | PPIC_HUMAN | P45877 | PPIC | PF00160 | 39-199 | ||
| 19 | PPID_HUMAN | Q08752 | PPID | PF00515 | 222-255 272-305 306-339 |
PF00160 | 16-183 |
| 20 | PPIE_HUMAN | Q9UNP9 | PPIE | PF00076 | 8-79 | PF00160 | 141-300 |
| 21 | PPIF_HUMAN | P30405 | PPIF | PF00160 | 47-206 | ||
| 22 | PPIG_HUMAN | Q13427 | PPIG | PF00160 | 9-177 | ||
| 23 | PPIH_HUMAN | O43447 | PPIH | PF00160 | 12-177 | ||
| 24 | PPIL1_HUMAN | Q9Y3C6 | PPIL1 | PF00160 | 13-165 | ||
| 25 | PPIL2_HUMAN | Q13356 | PPIL2 | PF00160 | 281-434 | ||
| 26 | PPIL3_HUMAN | Q9H2H8 | PPIL3 | PF00160 | 2-155 | ||
| 27 | PPIL4_HUMAN | Q8WUA2 | PPIL4 | PF00076 | 242-313 | PF00160 | 2-162 |
| 28 | PPIL6_HUMAN | Q8IXY8 | PPIL6 | PF00160 | 143-309 | ||
| 29 | PPWD1_HUMAN | Q96BP3 | PPWD1 | PF00400 | 123-161 284-308 |
PF00160 | 493-646 |
| 30 | Q6FH57_HUMAN | Q6FH57 | PPIH | PF00160 | 12-177 | ||
| 31 | Q6IBH5_HUMAN | Q6IBH5 | PPIB | PF00160 | 45-205 | ||
| 32 | Q6M1B6_HUMAN | Q6M1B6 | DKFZP686GO42 | PF00160 | 47-144 | ||
| 33 | FKBB_ECOLI | POA9L3 | FKBB | PF01346 | 1-107 | PF00254 | 111-202 |
| 34 | PPIA_ECOLI | POAFL3 | PPIA | PF00160; | 30-189 | ||
| 35 | PPIB_ECOLI | P23869 | PPIB | PF00160 | 1-163 | ||
| 36 | PPIC_ECOLI | POA9L5 | PPIC | PF00639 | 8-90 | ||
| 37 | PPID_ECOLI | P0ADY1 | PPID | PF00639 | 274-355 | ||
| 38 | FKBA_ECOLI | P45523 | FKPA | PF01346 | 23-152 | PF00254 | 156-264 |
| 39 | FKBX_ECOLI | P0AEM0 | FKPB | PF00254 | 10-140 | ||
| 40 | SLYD_ECOLI | P0A9K9 | SLYD | PF00254 | 2-137 | ||
| 41 | SURA_ECOLI | P0ABZ6 | SURA | PF00639 | 178-272 289-382 |
||
У 41 найденных ферментов было обнаружено 10 различных доменов Pfam, в некоторых ферментах имеется два различных домена, также встречаются случаи, когда в одном белке встречается несколько одинаковых доменов. Достаточно сложно сравнить доменную архитектуру всех 41 ферментов, поэтому разумно остановиться на сравнение 4-х ферментов (в таблице они выделены жирным шрифтом). У них у всех есть домен PF00254 (пептидил-пролил цис-транс изомеразный домен), у человеческого белка FKBP8_HUMAN есть еще и домен PF00515 (Tetratricopeptide TPR_1). Для домена PF00254 нет характерного местоположения в аминокислотной последовательности, в 4-х разных последовательностях, он расположен в разных местах последовательности. Кроме того, домены из разных белков имеют разную длину. Можно сделать вывод, что не наблюдается общей формы устройства доменной архитектуры для 4-х выбранных нами белков.
Ввиду того, что если строить попарное выравнивание всех 41 аминокислотных последовательностей, придется построить 820 выравниваний. Построить и проанализировать такое количество выравниваний в обозримое время не представляется возможным, поэтому выберем по 2 последовательности из кишечной палочки и человека случайным образом и исследуем их. Выбранные документы выделены жирным в таблице выше. Гомологичный домен для выбранных четырех последовательностей является PF00254 (пептидил-пролил цис-транс изомеразный домен).
Чтобы оценить сходство аминокислотных последовательностей гомологичных доменов, получим их FASTA последовательности, а затем построим попарное выравнивание. Предварительно вырезав последовательности нужных доменов с помощью программы seqret. Был создан скрипт, который позволяет получить все результаты в одном файле.
########################################
# Program: needle
# Rundate: Tue Mar 27 2007 23:08:05
# Commandline: needle
# [-asequence] fkb1a_human.fasta
# [-bsequence] fkbp6_human.fasta
# -gapopen 10
# -gapextend 0.5
# [-outfile] stdout
# Align_format: srspair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: FKB1A_HUMAN
# 2: FKBP6_HUMAN
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 101
# Identity: 32/101 (31.7%)
# Similarity: 49/101 (48.5%)
# Gaps: 16/101 (15.8%)
# Score: 149.0
#
#
#=======================================
FKB1A_HUMAN 1 PGDGRTFPKRGQTCVVHYTGMLED-GKKFDSSRDRNKPFKFMLGKQEVIR 49
..:.:|.|:|.||. .:.|||:..|..|....||:...:.
FKBP6_HUMAN 1 ----------DASVLVKYSGYLEHMDRPFDSNYFRKTPRLMKLGEDITLW 40
FKB1A_HUMAN 50 GWEEGVAQMSVGQRAKLTISPDYAYGATGHPGIIPPHATLVFDVEL---- 95
|.|.|:..|..|:.|:....|:||||..|.|.:|||:.|::|::||
FKBP6_HUMAN 41 GMELGLLSMRRGELARFLFKPNYAYGTLGCPPLIPPNTTVLFEIELLDFL 90
FKB1A_HUMAN 95 - 95
FKBP6_HUMAN 91 D 91
#---------------------------------------
#---------------------------------------
########################################
# Program: needle
# Rundate: Tue Mar 27 2007 23:08:05
# Commandline: needle
# [-asequence] fkb1a_human.fasta
# [-bsequence] fkbx_ecoli.fasta
# -gapopen 10
# -gapextend 0.5
# [-outfile] stdout
# Align_format: srspair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: FKB1A_HUMAN
# 2: FKBX_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 143
# Identity: 30/143 (21.0%)
# Similarity: 49/143 (34.3%)
# Gaps: 60/143 (42.0%)
# Score: 103.5
#
#
#=======================================
FKB1A_HUMAN 1 PGDGRTFPKRGQTCVVHYTGMLEDGKKFDSSRDRNKPFKFMLGKQEVIRG 50
..:||:|..|:||...:|:|:..||..|.||...:..|
FKBX_ECOLI 1 ------------AVLVHFTLKLDDGTTAESTRNNGKPALFRLGDASLSEG 38
FKB1A_HUMAN 51 WEEGVAQMSVGQRAKLTISPDYAYG------------------------- 75
.|:.:..:.||.:...::.||.|:|
FKBX_ECOLI 39 LEQHLLGLKVGDKTTFSLEPDAAFGVPSPDLIQYFSRREFMDAGEPEIGA 88
FKB1A_HUMAN 76 --------ATGHPGII-------------PPHA--TLVFDVEL 95
.:..||:| .|.| |:.||:|:
FKBX_ECOLI 89 IMLFTAMDGSEMPGVIREINGDSITVDFNHPLAGQTVHFDIEV 131
#---------------------------------------
#---------------------------------------
########################################
# Program: needle
# Rundate: Tue Mar 27 2007 23:08:05
# Commandline: needle
# [-asequence] fkb1a_human.fasta
# [-bsequence] slyd_ecoli.fasta
# -gapopen 10
# -gapextend 0.5
# [-outfile] stdout
# Align_format: srspair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: FKB1A_HUMAN
# 2: SLYD_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 145
# Identity: 25/145 (17.2%)
# Similarity: 37/145 (25.5%)
# Gaps: 59/145 (40.7%)
# Score: 47.0
#
#
#=======================================
FKB1A_HUMAN 1 PGDGRTFPKRGQTCVVH--YTGMLEDGKKFDSSRDRNKPFKFMLGKQEVI 48
|..:..||. |....|||...|.| ..:.|..::.|...:|
SLYD_ECOLI 1 --------KVAKDLVVSLAYQVRTEDGVLVDES-PVSAPLDYLHGHGSLI 41
FKB1A_HUMAN 49 RGWEEGVAQMSVGQRAKLTISPDYAYG----------------------- 75
.|.|..:....||.:..:.:..:.|||
SLYD_ECOLI 42 SGLETALEGHEVGDKFDVAVGANDAYGQYDENLVQRVPKDVFMGVDELQV 91
FKB1A_HUMAN 76 -----ATGHPGIIPPHATLVFDVEL-------------------- 95
|....|.:|...|.|.|..:
SLYD_ECOLI 92 GMRFLAETDQGPVPVEITAVEDDHVVVDGNHMLAGQNLKFNVEVV 136
#---------------------------------------
#---------------------------------------
########################################
# Program: needle
# Rundate: Tue Mar 27 2007 23:08:05
# Commandline: needle
# [-asequence] fkbp6_human.fasta
# [-bsequence] fkbx_ecoli.fasta
# -gapopen 10
# -gapextend 0.5
# [-outfile] stdout
# Align_format: srspair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: FKBP6_HUMAN
# 2: FKBX_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 147
# Identity: 22/147 (15.0%)
# Similarity: 40/147 (27.2%)
# Gaps: 72/147 (49.0%)
# Score: 62.0
#
#
#=======================================
FKBP6_HUMAN 1 DASVLVKYSGYLEHMDRPFDSNYFRKT-----PRLMKLGEDITLWGMELG 45
:|||.::..|: |......| |.|.:||:.....|:|..
FKBX_ECOLI 1 --AVLVHFTLKLD------DGTTAESTRNNGKPALFRLGDASLSEGLEQH 42
FKBP6_HUMAN 46 LLSMRRGELARFLFKPNYAYGTLGCPPLIPPNTTVLFEIELLDFLD---- 91
||.::.|:...|..:|:.|:|. |:..::......:|:|
FKBX_ECOLI 43 LLGLKVGDKTTFSLEPDAAFGV--------PSPDLIQYFSRREFMDAGEP 84
FKBP6_HUMAN 91 ----------------------------------------------- 91
FKBX_ECOLI 85 EIGAIMLFTAMDGSEMPGVIREINGDSITVDFNHPLAGQTVHFDIEV 131
#---------------------------------------
#---------------------------------------
########################################
# Program: needle
# Rundate: Tue Mar 27 2007 23:08:05
# Commandline: needle
# [-asequence] fkbp6_human.fasta
# [-bsequence] slyd_ecoli.fasta
# -gapopen 10
# -gapextend 0.5
# [-outfile] stdout
# Align_format: srspair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: FKBP6_HUMAN
# 2: SLYD_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 174
# Identity: 19/174 (10.9%)
# Similarity: 31/174 (17.8%)
# Gaps: 121/174 (69.5%)
# Score: 17.5
#
#
#=======================================
FKBP6_HUMAN 0 -------------------------------------------------- 0
SLYD_ECOLI 1 KVAKDLVVSLAYQVRTEDGVLVDESPVSAPLDYLHGHGSLISGLETALEG 50
FKBP6_HUMAN 1 --------------DASVLVKYSGYLEHMDRPFDSNYFRKTPRLMKLGED 36
|| |..| |.|..::.|:.:.:|.|
SLYD_ECOLI 51 HEVGDKFDVAVGANDA-----YGQY--------DENLVQRVPKDVFMGVD 87
FKBP6_HUMAN 37 ITLWGMELGLLSMRRGELARFLFKPNYAYGTLGCPPLIPPNTTVL----- 81
....|| |||.:.:.. | :|...|.:
SLYD_ECOLI 88 ELQVGM-------------RFLAETDQG-------P-VPVEITAVEDDHV 116
FKBP6_HUMAN 82 --------------FEIELLDFLD 91
|.:|::
SLYD_ECOLI 117 VVDGNHMLAGQNLKFNVEVV---- 136
#---------------------------------------
#---------------------------------------
########################################
# Program: needle
# Rundate: Tue Mar 27 2007 23:08:05
# Commandline: needle
# [-asequence] fkbx_ecoli.fasta
# [-bsequence] slyd_ecoli.fasta
# -gapopen 10
# -gapextend 0.5
# [-outfile] stdout
# Align_format: srspair
# Report_file: stdout
########################################
#=======================================
#
# Aligned_sequences: 2
# 1: FKBX_ECOLI
# 2: SLYD_ECOLI
# Matrix: EBLOSUM62
# Gap_penalty: 10.0
# Extend_penalty: 0.5
#
# Length: 139
# Identity: 42/139 (30.2%)
# Similarity: 67/139 (48.2%)
# Gaps: 11/139 ( 7.9%)
# Score: 151.5
#
#
#=======================================
FKBX_ECOLI 1 ------AVLVHFTLKLDDGTTAESTRNNGKPALFRLGDASLSEGLEQHLL 44
.|.:.:.::.:||...:.:..:. |..:..|..||..|||..|.
SLYD_ECOLI 1 KVAKDLVVSLAYQVRTEDGVLVDESPVSA-PLDYLHGHGSLISGLETALE 49
FKBX_ECOLI 45 GLKVGDKTTFSLEPDAAFGVPSPDLIQYFSRREFMDAGEPEIGAIMLFTA 94
|.:||||...::..:.|:|....:|:|...:..||...|.::| |.|.|
SLYD_ECOLI 50 GHEVGDKFDVAVGANDAYGQYDENLVQRVPKDVFMGVDELQVG--MRFLA 97
FKBX_ECOLI 95 -MDGSEMPGVIREINGDSITVDFNHPLAGQTVHFDIEV- 131
.|...:|..|..:..|.:.||.||.||||.:.|::||
SLYD_ECOLI 98 ETDQGPVPVEITAVEDDHVVVDGNHMLAGQNLKFNVEVV 136
#---------------------------------------
#---------------------------------------
|
На основании полученных результатов была создана сводная таблица, отражающая попарное сходство доменов.
| FKB1A_HUMAN | FKBP6_HUMAN | FKBX_ECOLI | SLYD_ECOLI | |
| FKB1A_HUMAN | 100% | |||
| FKBP6_HUMAN | 31.7% | 100% | ||
| FKBX_ECOLI | 21% | 15% | 100% | |
| SLYD_ECOLI | 17.2% | 10.9% | 30.2% | 100% |
Таким образом, из таблицы видно, что последовательности гомологичных доменов имеют очень низкий процент идентичности (менее 35%). Для последовательностей из одного организма процент идентичности несколько выше, чем для различных организмов, хотя и незначительно. Все это свидетельствует о низкой консервативности последовательности домена. Возможно, высокая консервативность наблюдается в тонкой структуре последовательности, то есть в пределах нескольких аминокислот в определенном участке.
Из полученных выше данных (выравнивание гомологичных доменов, сравнение доменной архитектуры) можно говорить о том, что для выполнения определенной функции белком его последовательность решающей роли не играет. Очевидно, намного важнее третичная структура белка и консервативность аминокислотных остатков в каталитическом центре.