Классификация ферметов (EC)
Сбор информации о своем ферменте
В таблице нашла против своего номера идентификатор UniProt человеческого фермента. Мне достался белок Q6ZWT7
- EC-код: 2.3.1.-; 2.3.1.51; 2.3.1.n7
- Расшифровка EC-кода и перевод на русский активностей, соответствующей каждому из четырех чисел кода:
- 2 - трансфераза,
- 2.3 - ацилтрансфераза,
- 2.3.1 - передача еще каких-то групп, кроме амино-ацильной;
- далее либо 1-ацилглицерол-3-фосфат O-ацилтрансфераза, либо нечто, чего нет в номенклатуре NC-IUBMB - 1-ацилглицерофосфоэтаноламин O-ацилтрансфераза.
- Схема катализируемой реакции: acyl-CoA + 1-acyl-sn-glycerol 3-phosphate = CoA + 1,2-diacyl-sn-glycerol 3-phosphate.
Сколько ферментов человека с близкими функциями описано в Swiss-Prot?
Количество белков человека, которые являются ферментами с тем же классом по EC - 5752, 481 — с тем же классом и подклассом, имеют общие с моим ферментом три уровня классификации - 408 и 24 — все четыре.
Насколько сохраняется функция фермента у белков со сходными последовательностями?
С помощью UniProt получила список всех белков мыши (Mus musculus) из Swiss-Prot, у которых класс (т.е., первое число) классификации EC совпадает с таковым моего фермента. Полученный результат сохранила в виде двух файлов, в одном - последовательности в Fasta-формате, в другом — текстовая таблица, в которой против ID каждого белка указан его полный EC-код. Всего нашлось 1744 белка, у 227 из них совпадает подкласс по EC (второе число), у 200 — также и третье, у 14 — вся классификация.
Пользуясь программой blastp, нашла среди белков, найденных в предыдущем пункте, сходные по последовательности с моим ферментом. Порог по e-value оставила по умолчанию - 10.
Всего нашлось 100 белков, а достоверными гомологами, по моему мнению, можно считать 5 из них (белки с E-value меньше 5e-25 или процент схожести не менее 40%). Ниже приведена таблица, отражающая, насколько сохраняется функция (т.е. подкласс, подподкласс и порядковый номер EC) в зависимости от позиции находки в выдаче blastp (таблица 1).
Таблица 1. Зависимость номера EC от позиции находки по запросу Q6ZWT7
Номер находки | Номер AC | Номер EC |
1 | Q3V1N9 | 2.7.10.1 |
2 | Q3UHJ0 | 2.7.10.1 |
3 | Q5EG47 | 2.7.10.1 |
4 | Q8BRK8 | 2.7.1.158 |
5 | Q7TSV6 | 2.7.4.21 |
6 | P05202 | 2.7.11.1 |
7 | Q9DBL9 | 2.7.7.7 |
8 | P00520 | 2.7.11.1 |
9 | Q4JIM5 | 2.7.10.1 |
10 | O54967 | 2.3.1.- |
11 | Q91V92 | 2.7.1.11 |
12 | A2AKK5 | 2.3.1.- |
13 | Q8BGG9 | 2.7.1.158 |
14 | Q8K348 | 2.7.1.158 |
15 | Q61271 | 2.7.10.1 |
16 | P37172 | 2.7.11.1 |
17 | Q8C0I1 | 2.7.1.158 |
18 | Q9D0L4 | 2.7.7.7 |
19 | Q6NSR3 | 2.7.10.1 |
20 | Q60936 | 2.7.10.1 |
21 | Q566J8 | 2.7.10.1 |
22 | Q80V03 | 2.7.1.158 |
23 | Q8VDL4 | 2.7.1.11 |
24 | Q9CQF6 | 2.7.7.7 |
25 | P55264 | 2.7.10.1 |
26 | Q3UGP8 | 2.7.10.1 |
27 | Q9ESW4 | 2.7.7.7 |
28 | Q3UEG6 | 2.7.10.1 |
29 | Q9WUA6 | 2.7.7.7 |
30 | Q60823 | 2.7.10.1 |
31 | P31750 | 2.7.11.1 |
32 | Q8BGT5 | 2.7.1.158 |
33 | Q8QZR5 | 2.7.1.11 |
34 | Q3TZM9 | 2.7.10.1 |
35 | Q8VDB2 | 2.7.1.11 |
36 | Q9D8C3 | 2.7.7.7 |
37 | Q921Q3 | 2.7.7.7 |
38 | Q9DBE8 | 2.7.7.7 |
39 | Q8K2A8 | 2.7.1.158 |
40 | Q9DB25 | 2.7.7.7 |
41 | Q3TAE8 | 2.7.10.1 |
42 | Q8VDI9 | 2.7.1.11 |
43 | Q6P8H8 | 2.7.10.1 |
44 | Q80Y20 | 2.7.1.158 |
45 | P97793 | 2.7.10.1 |
46 | Q9CXB8 | 2.7.7.7 |
47 | Q91ZB0 | 2.7.7.7 |
48 | Q8BZ25 | 2.7.1.158 |
49 | Q3U3W5 | 2.7.10.1 |
50 | Q9JIF0 | 2.7.7.7 |
51 | Q922H1 | 2.7.7.7 |
52 | Q9R144 | 2.7.7.7 |
53 | Q8CIG8 | 2.7.1.158 |
54 | Q6NZB1 | 2.7.10.1 |
55 | Q922X9 | 2.7.7.7 |
56 | Q6PAK3 | 2.7.10.1 |
57 | P04627 | 2.7.11.1 |
58 | Q99MK8 | 2.7.7.7 |
59 | Q3UYH7 | 2.7.10.1 |
60 | P50294 | 2.7.10.1 |
61 | P50296 | 2.7.10.1 |
62 | Q91WU5 | 2.7.1.11 |
63 | D3KU66 | 2.3.1.- |
64 | D3KU67 | 2.3.1.- |
65 | Q9Z2A5 | 2.7.7.7 |
66 | P16951 | 2.7.11.1 |
67 | Q62388 | 2.7.10.1 |
68 | Q9JKK8 | 2.7.7.7 |
69 | Q8QZR1 | 2.7.1.11 |
70 | O88445 | 2.3.1.- |
71 | O70126 | 2.3.1.- |
72 | P27038 | 2.7.11.1 |
73 | P27040 | 2.7.11.1 |
74 | Q6E1M8 | 2.7.10.1 |
75 | A2ADU9 | 2.3.1.75 |
76 | Q9CW73 | 2.7.7.7 |
77 | P58158 | 2.7.10.1 |
78 | Q8BG28 | 2.7.1.158 |
79 | Q8BHT6 | 2.7.1.158 |
80 | Q8BWP8 | 2.7.1.158 |
81 | Q9Z222 | 2.7.7.7 |
82 | Q8BGY6 | 2.7.1.158 |
83 | Q1RLK6 | 2.7.10.1 |
84 | Q3U129 | 2.7.10.1 |
85 | Q8VI16 | 2.7.1.11 |
86 | Q8R3I9 | 2.7.1.11 |
87 | O54904 | 2.3.1.- |
88 | Q8K0J2 | 2.7.1.158 |
89 | Q9Z0F0 | 2.7.7.7 |
90 | O54905 | 2.3.1.- |
91 | Q91Z92 | 2.7.7.7 |
92 | Q9JI67 | 2.7.7.7 |
93 | P15535 | 2.7.11.1 |
94 | Q6L8S8 | 2.7.10.1 |
95 | Q8R087 | 2.7.1.11 |
96 | Q9Z2Y2 | 2.7.7.7 |
97 | Q91YY2 | 2.7.7.7 |
98 | Q91X34 | 2.7.1.11 |
99 | Q9Z277 | 2.7.7.7 |
100 | P24288 | 2.7.11.1 |
Мне абсолютно не нравится то, что по моему запросу среди моих выбранных хитов не нашлось ферментов с заданной активностью. Для дальшейшего исследования выбрала другой AC моего фермента и составила таблицу 2.
Таблица 2. Зависимость номера EC от позиции находки по запросу Q8NCE7 (132 аминокислотных остатка)
Номер находки | Номер AC | Номер EC |
1 | Q9WVM8 | 2.7.7.7 |
2 | Q3UHJ0 | 2.7.10.1 |
3 | Q7TSV6 | 2.7.4.21 |
4 | Q4JIM5 | 2.7.10.1 |
5 | A2AKK5 | 2.3.1.- |
6 | Q8BGG9 | 2.7.1.158 |
7 | Q8K348 | 2.7.1.158 |
8 | Q61271 | 2.7.10.1 |
9 | P37172 | 2.7.11.1 |
10 | Q8C0I1 | 2.7.1.158 |
11 | Q9D0L4 | 2.7.7.7 |
12 | Q6NSR3 | 2.7.10.1 |
13 | Q60936 | 2.7.10.1 |
14 | Q566J8 | 2.7.10.1 |
15 | Q80V03 | 2.7.1.158 |
16 | Q8VDL4 | 2.7.1.11 |
17 | Q9CQF6 | 2.7.7.7 |
18 | Q3UGP8 | 2.7.10.1 |
19 | Q3UEG6 | 2.7.10.1 |
20 | Q60823 | 2.7.10.1 |
21 | P31750 | 2.7.11.1 |
22 | Q8BGT5 | 2.7.1.158 |
23 | Q3TZM9 | 2.7.10.1 |
24 | Q8VDB2 | 2.7.1.11 |
25 | Q9D8C3 | 2.7.7.7 |
26 | Q921Q3 | 2.7.7.7 |
27 | Q9DBE8 | 2.7.7.7 |
28 | Q8K2A8 | 2.7.1.158 |
29 | Q9DB25 | 2.7.7.7 |
30 | Q3TAE8 | 2.7.10.1 |
31 | Q8VDI9 | 2.7.1.11 |
32 | Q6P8H8 | 2.7.10.1 |
33 | Q80Y20 | 2.7.1.158 |
34 | P97793 | 2.7.10.1 |
35 | Q924C5 | 2.7.7.7 |
36 | Q91ZB0 | 2.7.7.7 |
37 | Q8BZ25 | 2.7.1.158 |
38 | Q3U3W5 | 2.7.10.1 |
39 | Q9R144 | 2.7.7.7 |
40 | Q8CIG8 | 2.7.1.158 |
41 | Q922X9 | 2.7.7.7 |
42 | Q6PAK3 | 2.7.10.1 |
43 | Q99MK8 | 2.7.7.7 |
44 | Q3UYH7 | 2.7.10.1 |
45 | P50296 | 2.7.10.1 |
46 | Q99MY8 | 2.7.7.7 |
47 | P16951 | 2.7.11.1 |
48 | Q62388 | 2.7.10.1 |
49 | Q9JKK8 | 2.7.7.7 |
50 | O88445 | 2.3.1.- |
51 | O70126 | 2.3.1.- |
52 | P27038 | 2.7.11.1 |
53 | Q6E1M8 | 2.7.10.1 |
54 | A2ADU9 | 2.3.1.75 |
55 | Q920V1 | 2.7.7.7 |
56 | Q8BG28 | 2.7.1.158 |
57 | Q8BHT6 | 2.7.1.158 |
58 | Q8BWP8 | 2.7.1.158 |
59 | Q9Z222 | 2.7.7.7 |
60 | Q8BGY6 | 2.7.1.158 |
61 | Q1RLK6 | 2.7.10.1 |
62 | Q3U129 | 2.7.10.1 |
63 | Q8VI16 | 2.7.1.11 |
64 | Q8R3I9 | 2.7.1.11 |
65 | O54904 | 2.3.1.- |
66 | Q8K0J2 | 2.7.1.158 |
67 | O54905 | 2.3.1.- |
68 | Q91Z92 | 2.7.7.7 |
69 | Q9JI67 | 2.7.7.7 |
70 | Q09200 | 2.7.10.1 |
71 | Q09199 | 2.7.10.1 |
72 | Q6L8S8 | 2.7.10.1 |
73 | Q8R087 | 2.7.1.11 |
74 | Q9WVK5 | 2.7.7.7 |
75 | Q9Z277 | 2.7.7.7 |
76 | Q6PAJ1 | 2.7.10.1 |
77 | P38649 | 2.7.11.1 |
78 | O35490 | 2.3.1.- |
79 | Q91WS4 | 2.7.1.11 |
80 | P16277 | 2.7.11.1 |
81 | P36898 | 2.7.11.1 |
82 | Q8BXK4 | 2.7.1.158 |
83 | P36895 | 2.7.11.1 |
84 | Q91YP1 | 2.7.7.7 |
85 | P97504 | 2.7.10.1 |
86 | P28028 | 2.7.11.1 |
87 | Q69Z98 | 2.7.10.1 |
88 | P35991 | 2.7.11.1 |
89 | Q9Z1S0 | 2.7.7.7 |
90 | O08901 | 2.3.1.- |
91 | Q9JJ06 | 2.7.7.7 |
92 | Q8CAK1 | 2.7.1.158 |
93 | Q9WVG6 | 2.7.7.7 |
94 | P45481 | 2.7.10.1 |
95 | P24788 | 2.7.11.1 |
96 | Q3UMM4 | 2.7.10.1 |
97 | Q14AX6 | 2.7.10.1 |
98 | Q3V3A1 | 2.7.10.1 |
99 | Q8K0D0 | 2.7.1.158 |
100 | Q69ZA1 | 2.7.10.1 |
О господи, да что не так с этим миром! (номера EC ко всем этим белкам определяются единственным образом) И почему он выдает всегда ровно 100 хитов! Ровно столько всегда пугающе остается после удаления дубликатов.
Таблица 3. Зависимость номера EC от позиции находки по запросу Q96KY4 (350 аминокислотных остатков)
Номер находки | Номер AC | Номер EC |
1 | Q3V1N9 | 2.7.10.1 |
2 | Q9WVM8 | 2.7.7.7 |
3 | Q7TSV6 | 2.7.4.21 |
4 | P05202 | 2.7.11.1 |
5 | Q9DBL9 | 2.7.7.7 |
6 | P00520 | 2.7.11.1 |
7 | Q4JIM5 | 2.7.10.1 |
8 | O54967 | 2.3.1.- |
9 | A2AKK5 | 2.3.1.- |
10 | Q8BGG9 | 2.7.1.158 |
11 | Q8K348 | 2.7.1.158 |
12 | Q61271 | 2.7.10.1 |
13 | P37172 | 2.7.11.1 |
14 | Q61288 | 2.7.10.1 |
15 | Q8C0I1 | 2.7.1.158 |
16 | Q9D0L4 | 2.7.7.7 |
17 | Q6NSR3 | 2.7.10.1 |
18 | Q60936 | 2.7.10.1 |
19 | Q566J8 | 2.7.10.1 |
20 | Q80V03 | 2.7.1.158 |
21 | Q8VDL4 | 2.7.1.11 |
22 | Q9CQF6 | 2.7.7.7 |
23 | P55264 | 2.7.10.1 |
24 | Q3UGP8 | 2.7.10.1 |
25 | Q9ESW4 | 2.7.7.7 |
26 | Q3UEG6 | 2.7.10.1 |
27 | Q9WUA6 | 2.7.7.7 |
28 | Q60823 | 2.7.10.1 |
29 | Q8BGT5 | 2.7.1.158 |
30 | Q8QZR5 | 2.7.1.11 |
31 | Q3TZM9 | 2.7.10.1 |
32 | Q8VDB2 | 2.7.1.11 |
33 | Q9D8C3 | 2.7.7.7 |
34 | Q921Q3 | 2.7.7.7 |
35 | Q9DBE8 | 2.7.7.7 |
36 | Q8K2A8 | 2.7.1.158 |
37 | Q9DB25 | 2.7.7.7 |
38 | Q3TAE8 | 2.7.10.1 |
39 | Q8VDI9 | 2.7.1.11 |
40 | Q6P8H8 | 2.7.10.1 |
41 | Q80Y20 | 2.7.1.158 |
42 | P97793 | 2.7.10.1 |
43 | Q91ZB0 | 2.7.7.7 |
44 | Q8BZ25 | 2.7.1.158 |
45 | Q3U3W5 | 2.7.10.1 |
46 | Q9JIF0 | 2.7.7.7 |
47 | Q922H1 | 2.7.7.7 |
48 | Q9R144 | 2.7.7.7 |
49 | Q8CIG8 | 2.7.1.158 |
50 | Q6NZB1 | 2.7.10.1 |
51 | Q922X9 | 2.7.7.7 |
52 | Q6PAK3 | 2.7.10.1 |
53 | P04627 | 2.7.11.1 |
54 | P50296 | 2.3.1.75 |
55 | Q91WU5 | 2.7.1.11 |
56 | Q99MY8 | 2.7.7.7 |
57 | D3KU66 | 2.3.1.- |
58 | D3KU67 | 2.3.1.- |
59 | Q8K341 | 2.7.1.158 |
60 | Q9Z2A5 | 2.7.7.7 |
61 | P16951 | 2.7.11.1 |
62 | Q62388 | 2.7.10.1 |
63 | Q9JKK8 | 2.7.7.7 |
64 | Q8QZR1 | 2.7.1.11 |
65 | O88445 | 2.3.1.- |
66 | O70126 | 2.3.1.- |
67 | P27038 | 2.7.11.1 |
68 | P27040 | 2.7.11.1 |
69 | Q6E1M8 | 2.7.10.1 |
70 | A2ADU9 | 2.3.1.75 |
71 | Q9CW73 | 2.7.7.7 |
72 | P59270 | 2.7.10.1 |
73 | P58158 | 2.7.10.1 |
74 | Q920V1 | 2.7.7.7 |
75 | Q8BG28 | 2.7.1.158 |
76 | Q8BHT6 | 2.7.1.158 |
77 | Q8BWP8 | 2.7.1.158 |
78 | Q5JCS9 | 2.7.10.1 |
79 | Q9Z222 | 2.7.7.7 |
80 | Q8BGY6 | 2.7.1.158 |
81 | Q1RLK6 | 2.7.10.1 |
82 | Q8VI16 | 2.7.1.11 |
83 | Q8R3I9 | 2.7.1.11 |
84 | O54904 | 2.3.1.- |
85 | Q8K0J2 | 2.7.1.158 |
86 | Q9Z0F0 | 2.7.7.7 |
87 | O54905 | 2.3.1.- |
88 | Q91Z92 | 2.7.7.7 |
89 | Q9JI67 | 2.7.7.7 |
90 | P15535 | 2.7.11.1 |
91 | Q6L8S8 | 2.7.10.1 |
92 | Q8R087 | 2.7.1.11 |
93 | Q91X34 | 2.7.1.11 |
94 | Q9Z277 | 2.7.7.7 |
95 | P24288 | 2.7.11.1 |
96 | O35855 | 2.3.1.- |
97 | Q6PAJ1 | 2.7.10.1 |
98 | P38649 | 2.7.11.1 |
99 | O35490 | 2.3.1.- |
100 | P36898 | 2.7.11.1 |
Что из таблиц видно, но непонятно - это наличие в верхней части списка EC 2.7.10.1 (рецептор протеин-тирозин киназы, ATP + a [protein]-L-tyrosine = ADP + a [protein]-L-tyrosine phosphate), EC 2.7.7.7 (ДНК-зависимая ДНК-полимераза, deoxynucleoside triphosphate + DNAn = diphosphate + DNAn+1), EC 2.7.4.21 (инозитол-гексакисфосфат киназа, ATP + 1D-myo-inositol hexakisphosphate = ADP + 1D-myo-inositol 5-diphosphate 1,2,3,4,6-pentakisphosphate), EC 2.7.11.1 (неспецифичная серин-треонин киназа, ATP + a protein = ADP + a phosphoprotein). Находки с номерами 2.3.1. не проходят по длине выравнивания (на мой взгляд, выравнивания слишком короткие, чтобы предсказывать гомологию).