Классификация ферметов (EC)

Сбор информации о своем ферменте

В таблице нашла против своего номера идентификатор UniProt человеческого фермента. Мне достался белок Q6ZWT7

  1. EC-код: 2.3.1.-; 2.3.1.51; 2.3.1.n7
  2. Расшифровка EC-кода и перевод на русский активностей, соответствующей каждому из четырех чисел кода:
    1. 2 - трансфераза,
    2. 2.3 - ацилтрансфераза,
    3. 2.3.1 - передача еще каких-то групп, кроме амино-ацильной;
    4. далее либо 1-ацилглицерол-3-фосфат O-ацилтрансфераза, либо нечто, чего нет в номенклатуре NC-IUBMB - 1-ацилглицерофосфоэтаноламин O-ацилтрансфераза.
  3. Схема катализируемой реакции: acyl-CoA + 1-acyl-sn-glycerol 3-phosphate = CoA + 1,2-diacyl-sn-glycerol 3-phosphate.

Сколько ферментов человека с близкими функциями описано в Swiss-Prot?

Количество белков человека, которые являются ферментами с тем же классом по EC - 5752, 481 — с тем же классом и подклассом, имеют общие с моим ферментом три уровня классификации - 408 и 24 — все четыре.

Насколько сохраняется функция фермента у белков со сходными последовательностями?

С помощью UniProt получила список всех белков мыши (Mus musculus) из Swiss-Prot, у которых класс (т.е., первое число) классификации EC совпадает с таковым моего фермента. Полученный результат сохранила в виде двух файлов, в одном - последовательности в Fasta-формате, в другом — текстовая таблица, в которой против ID каждого белка указан его полный EC-код. Всего нашлось 1744 белка, у 227 из них совпадает подкласс по EC (второе число), у 200 — также и третье, у 14 — вся классификация.

Пользуясь программой blastp, нашла среди белков, найденных в предыдущем пункте, сходные по последовательности с моим ферментом. Порог по e-value оставила по умолчанию - 10.

Всего нашлось 100 белков, а достоверными гомологами, по моему мнению, можно считать 5 из них (белки с E-value меньше 5e-25 или процент схожести не менее 40%). Ниже приведена таблица, отражающая, насколько сохраняется функция (т.е. подкласс, подподкласс и порядковый номер EC) в зависимости от позиции находки в выдаче blastp (таблица 1).

Таблица 1. Зависимость номера EC от позиции находки по запросу Q6ZWT7

Номер находки Номер AC Номер EC
1 Q3V1N9 2.7.10.1
2 Q3UHJ0 2.7.10.1
3 Q5EG47 2.7.10.1
4 Q8BRK8 2.7.1.158
5 Q7TSV6 2.7.4.21
6 P05202 2.7.11.1
7 Q9DBL9 2.7.7.7
8 P00520 2.7.11.1
9 Q4JIM5 2.7.10.1
10 O54967 2.3.1.-
11 Q91V92 2.7.1.11
12 A2AKK5 2.3.1.-
13 Q8BGG9 2.7.1.158
14 Q8K348 2.7.1.158
15 Q61271 2.7.10.1
16 P37172 2.7.11.1
17 Q8C0I1 2.7.1.158
18 Q9D0L4 2.7.7.7
19 Q6NSR3 2.7.10.1
20 Q60936 2.7.10.1
21 Q566J8 2.7.10.1
22 Q80V03 2.7.1.158
23 Q8VDL4 2.7.1.11
24 Q9CQF6 2.7.7.7
25 P55264 2.7.10.1
26 Q3UGP8 2.7.10.1
27 Q9ESW4 2.7.7.7
28 Q3UEG6 2.7.10.1
29 Q9WUA6 2.7.7.7
30 Q60823 2.7.10.1
31 P31750 2.7.11.1
32 Q8BGT5 2.7.1.158
33 Q8QZR5 2.7.1.11
34 Q3TZM9 2.7.10.1
35 Q8VDB2 2.7.1.11
36 Q9D8C3 2.7.7.7
37 Q921Q3 2.7.7.7
38 Q9DBE8 2.7.7.7
39 Q8K2A8 2.7.1.158
40 Q9DB25 2.7.7.7
41 Q3TAE8 2.7.10.1
42 Q8VDI9 2.7.1.11
43 Q6P8H8 2.7.10.1
44 Q80Y20 2.7.1.158
45 P97793 2.7.10.1
46 Q9CXB8 2.7.7.7
47 Q91ZB0 2.7.7.7
48 Q8BZ25 2.7.1.158
49 Q3U3W5 2.7.10.1
50 Q9JIF0 2.7.7.7
51 Q922H1 2.7.7.7
52 Q9R144 2.7.7.7
53 Q8CIG8 2.7.1.158
54 Q6NZB1 2.7.10.1
55 Q922X9 2.7.7.7
56 Q6PAK3 2.7.10.1
57 P04627 2.7.11.1
58 Q99MK8 2.7.7.7
59 Q3UYH7 2.7.10.1
60 P50294 2.7.10.1
61 P50296 2.7.10.1
62 Q91WU5 2.7.1.11
63 D3KU66 2.3.1.-
64 D3KU67 2.3.1.-
65 Q9Z2A5 2.7.7.7
66 P16951 2.7.11.1
67 Q62388 2.7.10.1
68 Q9JKK8 2.7.7.7
69 Q8QZR1 2.7.1.11
70 O88445 2.3.1.-
71 O70126 2.3.1.-
72 P27038 2.7.11.1
73 P27040 2.7.11.1
74 Q6E1M8 2.7.10.1
75 A2ADU9 2.3.1.75
76 Q9CW73 2.7.7.7
77 P58158 2.7.10.1
78 Q8BG28 2.7.1.158
79 Q8BHT6 2.7.1.158
80 Q8BWP8 2.7.1.158
81 Q9Z222 2.7.7.7
82 Q8BGY6 2.7.1.158
83 Q1RLK6 2.7.10.1
84 Q3U129 2.7.10.1
85 Q8VI16 2.7.1.11
86 Q8R3I9 2.7.1.11
87 O54904 2.3.1.-
88 Q8K0J2 2.7.1.158
89 Q9Z0F0 2.7.7.7
90 O54905 2.3.1.-
91 Q91Z92 2.7.7.7
92 Q9JI67 2.7.7.7
93 P15535 2.7.11.1
94 Q6L8S8 2.7.10.1
95 Q8R087 2.7.1.11
96 Q9Z2Y2 2.7.7.7
97 Q91YY2 2.7.7.7
98 Q91X34 2.7.1.11
99 Q9Z277 2.7.7.7
100 P24288 2.7.11.1

Мне абсолютно не нравится то, что по моему запросу среди моих выбранных хитов не нашлось ферментов с заданной активностью. Для дальшейшего исследования выбрала другой AC моего фермента и составила таблицу 2.

Таблица 2. Зависимость номера EC от позиции находки по запросу Q8NCE7 (132 аминокислотных остатка)

Номер находки Номер AC Номер EC
1 Q9WVM8 2.7.7.7
2 Q3UHJ0 2.7.10.1
3 Q7TSV6 2.7.4.21
4 Q4JIM5 2.7.10.1
5 A2AKK5 2.3.1.-
6 Q8BGG9 2.7.1.158
7 Q8K348 2.7.1.158
8 Q61271 2.7.10.1
9 P37172 2.7.11.1
10 Q8C0I1 2.7.1.158
11 Q9D0L4 2.7.7.7
12 Q6NSR3 2.7.10.1
13 Q60936 2.7.10.1
14 Q566J8 2.7.10.1
15 Q80V03 2.7.1.158
16 Q8VDL4 2.7.1.11
17 Q9CQF6 2.7.7.7
18 Q3UGP8 2.7.10.1
19 Q3UEG6 2.7.10.1
20 Q60823 2.7.10.1
21 P31750 2.7.11.1
22 Q8BGT5 2.7.1.158
23 Q3TZM9 2.7.10.1
24 Q8VDB2 2.7.1.11
25 Q9D8C3 2.7.7.7
26 Q921Q3 2.7.7.7
27 Q9DBE8 2.7.7.7
28 Q8K2A8 2.7.1.158
29 Q9DB25 2.7.7.7
30 Q3TAE8 2.7.10.1
31 Q8VDI9 2.7.1.11
32 Q6P8H8 2.7.10.1
33 Q80Y20 2.7.1.158
34 P97793 2.7.10.1
35 Q924C5 2.7.7.7
36 Q91ZB0 2.7.7.7
37 Q8BZ25 2.7.1.158
38 Q3U3W5 2.7.10.1
39 Q9R144 2.7.7.7
40 Q8CIG8 2.7.1.158
41 Q922X9 2.7.7.7
42 Q6PAK3 2.7.10.1
43 Q99MK8 2.7.7.7
44 Q3UYH7 2.7.10.1
45 P50296 2.7.10.1
46 Q99MY8 2.7.7.7
47 P16951 2.7.11.1
48 Q62388 2.7.10.1
49 Q9JKK8 2.7.7.7
50 O88445 2.3.1.-
51 O70126 2.3.1.-
52 P27038 2.7.11.1
53 Q6E1M8 2.7.10.1
54 A2ADU9 2.3.1.75
55 Q920V1 2.7.7.7
56 Q8BG28 2.7.1.158
57 Q8BHT6 2.7.1.158
58 Q8BWP8 2.7.1.158
59 Q9Z222 2.7.7.7
60 Q8BGY6 2.7.1.158
61 Q1RLK6 2.7.10.1
62 Q3U129 2.7.10.1
63 Q8VI16 2.7.1.11
64 Q8R3I9 2.7.1.11
65 O54904 2.3.1.-
66 Q8K0J2 2.7.1.158
67 O54905 2.3.1.-
68 Q91Z92 2.7.7.7
69 Q9JI67 2.7.7.7
70 Q09200 2.7.10.1
71 Q09199 2.7.10.1
72 Q6L8S8 2.7.10.1
73 Q8R087 2.7.1.11
74 Q9WVK5 2.7.7.7
75 Q9Z277 2.7.7.7
76 Q6PAJ1 2.7.10.1
77 P38649 2.7.11.1
78 O35490 2.3.1.-
79 Q91WS4 2.7.1.11
80 P16277 2.7.11.1
81 P36898 2.7.11.1
82 Q8BXK4 2.7.1.158
83 P36895 2.7.11.1
84 Q91YP1 2.7.7.7
85 P97504 2.7.10.1
86 P28028 2.7.11.1
87 Q69Z98 2.7.10.1
88 P35991 2.7.11.1
89 Q9Z1S0 2.7.7.7
90 O08901 2.3.1.-
91 Q9JJ06 2.7.7.7
92 Q8CAK1 2.7.1.158
93 Q9WVG6 2.7.7.7
94 P45481 2.7.10.1
95 P24788 2.7.11.1
96 Q3UMM4 2.7.10.1
97 Q14AX6 2.7.10.1
98 Q3V3A1 2.7.10.1
99 Q8K0D0 2.7.1.158
100 Q69ZA1 2.7.10.1

О господи, да что не так с этим миром! (номера EC ко всем этим белкам определяются единственным образом) И почему он выдает всегда ровно 100 хитов! Ровно столько всегда пугающе остается после удаления дубликатов.

Таблица 3. Зависимость номера EC от позиции находки по запросу Q96KY4 (350 аминокислотных остатков)

Номер находки Номер AC Номер EC
1 Q3V1N9 2.7.10.1
2 Q9WVM8 2.7.7.7
3 Q7TSV6 2.7.4.21
4 P05202 2.7.11.1
5 Q9DBL9 2.7.7.7
6 P00520 2.7.11.1
7 Q4JIM5 2.7.10.1
8 O54967 2.3.1.-
9 A2AKK5 2.3.1.-
10 Q8BGG9 2.7.1.158
11 Q8K348 2.7.1.158
12 Q61271 2.7.10.1
13 P37172 2.7.11.1
14 Q61288 2.7.10.1
15 Q8C0I1 2.7.1.158
16 Q9D0L4 2.7.7.7
17 Q6NSR3 2.7.10.1
18 Q60936 2.7.10.1
19 Q566J8 2.7.10.1
20 Q80V03 2.7.1.158
21 Q8VDL4 2.7.1.11
22 Q9CQF6 2.7.7.7
23 P55264 2.7.10.1
24 Q3UGP8 2.7.10.1
25 Q9ESW4 2.7.7.7
26 Q3UEG6 2.7.10.1
27 Q9WUA6 2.7.7.7
28 Q60823 2.7.10.1
29 Q8BGT5 2.7.1.158
30 Q8QZR5 2.7.1.11
31 Q3TZM9 2.7.10.1
32 Q8VDB2 2.7.1.11
33 Q9D8C3 2.7.7.7
34 Q921Q3 2.7.7.7
35 Q9DBE8 2.7.7.7
36 Q8K2A8 2.7.1.158
37 Q9DB25 2.7.7.7
38 Q3TAE8 2.7.10.1
39 Q8VDI9 2.7.1.11
40 Q6P8H8 2.7.10.1
41 Q80Y20 2.7.1.158
42 P97793 2.7.10.1
43 Q91ZB0 2.7.7.7
44 Q8BZ25 2.7.1.158
45 Q3U3W5 2.7.10.1
46 Q9JIF0 2.7.7.7
47 Q922H1 2.7.7.7
48 Q9R144 2.7.7.7
49 Q8CIG8 2.7.1.158
50 Q6NZB1 2.7.10.1
51 Q922X9 2.7.7.7
52 Q6PAK3 2.7.10.1
53 P04627 2.7.11.1
54 P50296 2.3.1.75
55 Q91WU5 2.7.1.11
56 Q99MY8 2.7.7.7
57 D3KU66 2.3.1.-
58 D3KU67 2.3.1.-
59 Q8K341 2.7.1.158
60 Q9Z2A5 2.7.7.7
61 P16951 2.7.11.1
62 Q62388 2.7.10.1
63 Q9JKK8 2.7.7.7
64 Q8QZR1 2.7.1.11
65 O88445 2.3.1.-
66 O70126 2.3.1.-
67 P27038 2.7.11.1
68 P27040 2.7.11.1
69 Q6E1M8 2.7.10.1
70 A2ADU9 2.3.1.75
71 Q9CW73 2.7.7.7
72 P59270 2.7.10.1
73 P58158 2.7.10.1
74 Q920V1 2.7.7.7
75 Q8BG28 2.7.1.158
76 Q8BHT6 2.7.1.158
77 Q8BWP8 2.7.1.158
78 Q5JCS9 2.7.10.1
79 Q9Z222 2.7.7.7
80 Q8BGY6 2.7.1.158
81 Q1RLK6 2.7.10.1
82 Q8VI16 2.7.1.11
83 Q8R3I9 2.7.1.11
84 O54904 2.3.1.-
85 Q8K0J2 2.7.1.158
86 Q9Z0F0 2.7.7.7
87 O54905 2.3.1.-
88 Q91Z92 2.7.7.7
89 Q9JI67 2.7.7.7
90 P15535 2.7.11.1
91 Q6L8S8 2.7.10.1
92 Q8R087 2.7.1.11
93 Q91X34 2.7.1.11
94 Q9Z277 2.7.7.7
95 P24288 2.7.11.1
96 O35855 2.3.1.-
97 Q6PAJ1 2.7.10.1
98 P38649 2.7.11.1
99 O35490 2.3.1.-
100 P36898 2.7.11.1

Что из таблиц видно, но непонятно - это наличие в верхней части списка EC 2.7.10.1 (рецептор протеин-тирозин киназы, ATP + a [protein]-L-tyrosine = ADP + a [protein]-L-tyrosine phosphate), EC 2.7.7.7 (ДНК-зависимая ДНК-полимераза, deoxynucleoside triphosphate + DNAn = diphosphate + DNAn+1), EC 2.7.4.21 (инозитол-гексакисфосфат киназа, ATP + 1D-myo-inositol hexakisphosphate = ADP + 1D-myo-inositol 5-diphosphate 1,2,3,4,6-pentakisphosphate), EC 2.7.11.1 (неспецифичная серин-треонин киназа, ATP + a protein = ADP + a phosphoprotein). Находки с номерами 2.3.1. не проходят по длине выравнивания (на мой взгляд, выравнивания слишком короткие, чтобы предсказывать гомологию).

 

 

© Дудина Дарья.