Классификация ферметов (EC)
Сбор информации о своем ферменте
В таблице нашла против своего номера идентификатор UniProt человеческого фермента. Мне достался белок Q6ZWT7
- EC-код: 2.3.1.-; 2.3.1.51; 2.3.1.n7
- Расшифровка EC-кода и перевод на русский активностей, соответствующей каждому из четырех чисел кода:
- 2 - трансфераза,
- 2.3 - ацилтрансфераза,
- 2.3.1 - передача еще каких-то групп, кроме амино-ацильной;
- далее либо 1-ацилглицерол-3-фосфат O-ацилтрансфераза, либо нечто, чего нет в номенклатуре NC-IUBMB - 1-ацилглицерофосфоэтаноламин O-ацилтрансфераза.
- Схема катализируемой реакции: acyl-CoA + 1-acyl-sn-glycerol 3-phosphate = CoA + 1,2-diacyl-sn-glycerol 3-phosphate.
Сколько ферментов человека с близкими функциями описано в Swiss-Prot?
Количество белков человека, которые являются ферментами с тем же классом по EC - 5752, 481 — с тем же классом и подклассом, имеют общие с моим ферментом три уровня классификации - 408 и 24 — все четыре.
Насколько сохраняется функция фермента у белков со сходными последовательностями?
С помощью UniProt получила список всех белков мыши (Mus musculus) из Swiss-Prot, у которых класс (т.е., первое число) классификации EC совпадает с таковым моего фермента. Полученный результат сохранила в виде двух файлов, в одном - последовательности в Fasta-формате, в другом — текстовая таблица, в которой против ID каждого белка указан его полный EC-код. Всего нашлось 1744 белка, у 227 из них совпадает подкласс по EC (второе число), у 200 — также и третье, у 14 — вся классификация.
Пользуясь программой blastp, нашла среди белков, найденных в предыдущем пункте, сходные по последовательности с моим ферментом. Порог по e-value оставила по умолчанию - 10.
Всего нашлось 100 белков, а достоверными гомологами, по моему мнению, можно считать 5 из них (белки с E-value меньше 5e-25 или процент схожести не менее 40%). Ниже приведена таблица, отражающая, насколько сохраняется функция (т.е. подкласс, подподкласс и порядковый номер EC) в зависимости от позиции находки в выдаче blastp (таблица 1).
Таблица 1. Зависимость номера EC от позиции находки по запросу Q6ZWT7
| Номер находки | Номер AC | Номер EC |
| 1 | Q3V1N9 | 2.7.10.1 |
| 2 | Q3UHJ0 | 2.7.10.1 |
| 3 | Q5EG47 | 2.7.10.1 |
| 4 | Q8BRK8 | 2.7.1.158 |
| 5 | Q7TSV6 | 2.7.4.21 |
| 6 | P05202 | 2.7.11.1 |
| 7 | Q9DBL9 | 2.7.7.7 |
| 8 | P00520 | 2.7.11.1 |
| 9 | Q4JIM5 | 2.7.10.1 |
| 10 | O54967 | 2.3.1.- |
| 11 | Q91V92 | 2.7.1.11 |
| 12 | A2AKK5 | 2.3.1.- |
| 13 | Q8BGG9 | 2.7.1.158 |
| 14 | Q8K348 | 2.7.1.158 |
| 15 | Q61271 | 2.7.10.1 |
| 16 | P37172 | 2.7.11.1 |
| 17 | Q8C0I1 | 2.7.1.158 |
| 18 | Q9D0L4 | 2.7.7.7 |
| 19 | Q6NSR3 | 2.7.10.1 |
| 20 | Q60936 | 2.7.10.1 |
| 21 | Q566J8 | 2.7.10.1 |
| 22 | Q80V03 | 2.7.1.158 |
| 23 | Q8VDL4 | 2.7.1.11 |
| 24 | Q9CQF6 | 2.7.7.7 |
| 25 | P55264 | 2.7.10.1 |
| 26 | Q3UGP8 | 2.7.10.1 |
| 27 | Q9ESW4 | 2.7.7.7 |
| 28 | Q3UEG6 | 2.7.10.1 |
| 29 | Q9WUA6 | 2.7.7.7 |
| 30 | Q60823 | 2.7.10.1 |
| 31 | P31750 | 2.7.11.1 |
| 32 | Q8BGT5 | 2.7.1.158 |
| 33 | Q8QZR5 | 2.7.1.11 |
| 34 | Q3TZM9 | 2.7.10.1 |
| 35 | Q8VDB2 | 2.7.1.11 |
| 36 | Q9D8C3 | 2.7.7.7 |
| 37 | Q921Q3 | 2.7.7.7 |
| 38 | Q9DBE8 | 2.7.7.7 |
| 39 | Q8K2A8 | 2.7.1.158 |
| 40 | Q9DB25 | 2.7.7.7 |
| 41 | Q3TAE8 | 2.7.10.1 |
| 42 | Q8VDI9 | 2.7.1.11 |
| 43 | Q6P8H8 | 2.7.10.1 |
| 44 | Q80Y20 | 2.7.1.158 |
| 45 | P97793 | 2.7.10.1 |
| 46 | Q9CXB8 | 2.7.7.7 |
| 47 | Q91ZB0 | 2.7.7.7 |
| 48 | Q8BZ25 | 2.7.1.158 |
| 49 | Q3U3W5 | 2.7.10.1 |
| 50 | Q9JIF0 | 2.7.7.7 |
| 51 | Q922H1 | 2.7.7.7 |
| 52 | Q9R144 | 2.7.7.7 |
| 53 | Q8CIG8 | 2.7.1.158 |
| 54 | Q6NZB1 | 2.7.10.1 |
| 55 | Q922X9 | 2.7.7.7 |
| 56 | Q6PAK3 | 2.7.10.1 |
| 57 | P04627 | 2.7.11.1 |
| 58 | Q99MK8 | 2.7.7.7 |
| 59 | Q3UYH7 | 2.7.10.1 |
| 60 | P50294 | 2.7.10.1 |
| 61 | P50296 | 2.7.10.1 |
| 62 | Q91WU5 | 2.7.1.11 |
| 63 | D3KU66 | 2.3.1.- |
| 64 | D3KU67 | 2.3.1.- |
| 65 | Q9Z2A5 | 2.7.7.7 |
| 66 | P16951 | 2.7.11.1 |
| 67 | Q62388 | 2.7.10.1 |
| 68 | Q9JKK8 | 2.7.7.7 |
| 69 | Q8QZR1 | 2.7.1.11 |
| 70 | O88445 | 2.3.1.- |
| 71 | O70126 | 2.3.1.- |
| 72 | P27038 | 2.7.11.1 |
| 73 | P27040 | 2.7.11.1 |
| 74 | Q6E1M8 | 2.7.10.1 |
| 75 | A2ADU9 | 2.3.1.75 |
| 76 | Q9CW73 | 2.7.7.7 |
| 77 | P58158 | 2.7.10.1 |
| 78 | Q8BG28 | 2.7.1.158 |
| 79 | Q8BHT6 | 2.7.1.158 |
| 80 | Q8BWP8 | 2.7.1.158 |
| 81 | Q9Z222 | 2.7.7.7 |
| 82 | Q8BGY6 | 2.7.1.158 |
| 83 | Q1RLK6 | 2.7.10.1 |
| 84 | Q3U129 | 2.7.10.1 |
| 85 | Q8VI16 | 2.7.1.11 |
| 86 | Q8R3I9 | 2.7.1.11 |
| 87 | O54904 | 2.3.1.- |
| 88 | Q8K0J2 | 2.7.1.158 |
| 89 | Q9Z0F0 | 2.7.7.7 |
| 90 | O54905 | 2.3.1.- |
| 91 | Q91Z92 | 2.7.7.7 |
| 92 | Q9JI67 | 2.7.7.7 |
| 93 | P15535 | 2.7.11.1 |
| 94 | Q6L8S8 | 2.7.10.1 |
| 95 | Q8R087 | 2.7.1.11 |
| 96 | Q9Z2Y2 | 2.7.7.7 |
| 97 | Q91YY2 | 2.7.7.7 |
| 98 | Q91X34 | 2.7.1.11 |
| 99 | Q9Z277 | 2.7.7.7 |
| 100 | P24288 | 2.7.11.1 |
Мне абсолютно не нравится то, что по моему запросу среди моих выбранных хитов не нашлось ферментов с заданной активностью. Для дальшейшего исследования выбрала другой AC моего фермента и составила таблицу 2.
Таблица 2. Зависимость номера EC от позиции находки по запросу Q8NCE7 (132 аминокислотных остатка)
| Номер находки | Номер AC | Номер EC |
| 1 | Q9WVM8 | 2.7.7.7 |
| 2 | Q3UHJ0 | 2.7.10.1 |
| 3 | Q7TSV6 | 2.7.4.21 |
| 4 | Q4JIM5 | 2.7.10.1 |
| 5 | A2AKK5 | 2.3.1.- |
| 6 | Q8BGG9 | 2.7.1.158 |
| 7 | Q8K348 | 2.7.1.158 |
| 8 | Q61271 | 2.7.10.1 |
| 9 | P37172 | 2.7.11.1 |
| 10 | Q8C0I1 | 2.7.1.158 |
| 11 | Q9D0L4 | 2.7.7.7 |
| 12 | Q6NSR3 | 2.7.10.1 |
| 13 | Q60936 | 2.7.10.1 |
| 14 | Q566J8 | 2.7.10.1 |
| 15 | Q80V03 | 2.7.1.158 |
| 16 | Q8VDL4 | 2.7.1.11 |
| 17 | Q9CQF6 | 2.7.7.7 |
| 18 | Q3UGP8 | 2.7.10.1 |
| 19 | Q3UEG6 | 2.7.10.1 |
| 20 | Q60823 | 2.7.10.1 |
| 21 | P31750 | 2.7.11.1 |
| 22 | Q8BGT5 | 2.7.1.158 |
| 23 | Q3TZM9 | 2.7.10.1 |
| 24 | Q8VDB2 | 2.7.1.11 |
| 25 | Q9D8C3 | 2.7.7.7 |
| 26 | Q921Q3 | 2.7.7.7 |
| 27 | Q9DBE8 | 2.7.7.7 |
| 28 | Q8K2A8 | 2.7.1.158 |
| 29 | Q9DB25 | 2.7.7.7 |
| 30 | Q3TAE8 | 2.7.10.1 |
| 31 | Q8VDI9 | 2.7.1.11 |
| 32 | Q6P8H8 | 2.7.10.1 |
| 33 | Q80Y20 | 2.7.1.158 |
| 34 | P97793 | 2.7.10.1 |
| 35 | Q924C5 | 2.7.7.7 |
| 36 | Q91ZB0 | 2.7.7.7 |
| 37 | Q8BZ25 | 2.7.1.158 |
| 38 | Q3U3W5 | 2.7.10.1 |
| 39 | Q9R144 | 2.7.7.7 |
| 40 | Q8CIG8 | 2.7.1.158 |
| 41 | Q922X9 | 2.7.7.7 |
| 42 | Q6PAK3 | 2.7.10.1 |
| 43 | Q99MK8 | 2.7.7.7 |
| 44 | Q3UYH7 | 2.7.10.1 |
| 45 | P50296 | 2.7.10.1 |
| 46 | Q99MY8 | 2.7.7.7 |
| 47 | P16951 | 2.7.11.1 |
| 48 | Q62388 | 2.7.10.1 |
| 49 | Q9JKK8 | 2.7.7.7 |
| 50 | O88445 | 2.3.1.- |
| 51 | O70126 | 2.3.1.- |
| 52 | P27038 | 2.7.11.1 |
| 53 | Q6E1M8 | 2.7.10.1 |
| 54 | A2ADU9 | 2.3.1.75 |
| 55 | Q920V1 | 2.7.7.7 |
| 56 | Q8BG28 | 2.7.1.158 |
| 57 | Q8BHT6 | 2.7.1.158 |
| 58 | Q8BWP8 | 2.7.1.158 |
| 59 | Q9Z222 | 2.7.7.7 |
| 60 | Q8BGY6 | 2.7.1.158 |
| 61 | Q1RLK6 | 2.7.10.1 |
| 62 | Q3U129 | 2.7.10.1 |
| 63 | Q8VI16 | 2.7.1.11 |
| 64 | Q8R3I9 | 2.7.1.11 |
| 65 | O54904 | 2.3.1.- |
| 66 | Q8K0J2 | 2.7.1.158 |
| 67 | O54905 | 2.3.1.- |
| 68 | Q91Z92 | 2.7.7.7 |
| 69 | Q9JI67 | 2.7.7.7 |
| 70 | Q09200 | 2.7.10.1 |
| 71 | Q09199 | 2.7.10.1 |
| 72 | Q6L8S8 | 2.7.10.1 |
| 73 | Q8R087 | 2.7.1.11 |
| 74 | Q9WVK5 | 2.7.7.7 |
| 75 | Q9Z277 | 2.7.7.7 |
| 76 | Q6PAJ1 | 2.7.10.1 |
| 77 | P38649 | 2.7.11.1 |
| 78 | O35490 | 2.3.1.- |
| 79 | Q91WS4 | 2.7.1.11 |
| 80 | P16277 | 2.7.11.1 |
| 81 | P36898 | 2.7.11.1 |
| 82 | Q8BXK4 | 2.7.1.158 |
| 83 | P36895 | 2.7.11.1 |
| 84 | Q91YP1 | 2.7.7.7 |
| 85 | P97504 | 2.7.10.1 |
| 86 | P28028 | 2.7.11.1 |
| 87 | Q69Z98 | 2.7.10.1 |
| 88 | P35991 | 2.7.11.1 |
| 89 | Q9Z1S0 | 2.7.7.7 |
| 90 | O08901 | 2.3.1.- |
| 91 | Q9JJ06 | 2.7.7.7 |
| 92 | Q8CAK1 | 2.7.1.158 |
| 93 | Q9WVG6 | 2.7.7.7 |
| 94 | P45481 | 2.7.10.1 |
| 95 | P24788 | 2.7.11.1 |
| 96 | Q3UMM4 | 2.7.10.1 |
| 97 | Q14AX6 | 2.7.10.1 |
| 98 | Q3V3A1 | 2.7.10.1 |
| 99 | Q8K0D0 | 2.7.1.158 |
| 100 | Q69ZA1 | 2.7.10.1 |
О господи, да что не так с этим миром! (номера EC ко всем этим белкам определяются единственным образом) И почему он выдает всегда ровно 100 хитов! Ровно столько всегда пугающе остается после удаления дубликатов.
Таблица 3. Зависимость номера EC от позиции находки по запросу Q96KY4 (350 аминокислотных остатков)
| Номер находки | Номер AC | Номер EC |
| 1 | Q3V1N9 | 2.7.10.1 |
| 2 | Q9WVM8 | 2.7.7.7 |
| 3 | Q7TSV6 | 2.7.4.21 |
| 4 | P05202 | 2.7.11.1 |
| 5 | Q9DBL9 | 2.7.7.7 |
| 6 | P00520 | 2.7.11.1 |
| 7 | Q4JIM5 | 2.7.10.1 |
| 8 | O54967 | 2.3.1.- |
| 9 | A2AKK5 | 2.3.1.- |
| 10 | Q8BGG9 | 2.7.1.158 |
| 11 | Q8K348 | 2.7.1.158 |
| 12 | Q61271 | 2.7.10.1 |
| 13 | P37172 | 2.7.11.1 |
| 14 | Q61288 | 2.7.10.1 |
| 15 | Q8C0I1 | 2.7.1.158 |
| 16 | Q9D0L4 | 2.7.7.7 |
| 17 | Q6NSR3 | 2.7.10.1 |
| 18 | Q60936 | 2.7.10.1 |
| 19 | Q566J8 | 2.7.10.1 |
| 20 | Q80V03 | 2.7.1.158 |
| 21 | Q8VDL4 | 2.7.1.11 |
| 22 | Q9CQF6 | 2.7.7.7 |
| 23 | P55264 | 2.7.10.1 |
| 24 | Q3UGP8 | 2.7.10.1 |
| 25 | Q9ESW4 | 2.7.7.7 |
| 26 | Q3UEG6 | 2.7.10.1 |
| 27 | Q9WUA6 | 2.7.7.7 |
| 28 | Q60823 | 2.7.10.1 |
| 29 | Q8BGT5 | 2.7.1.158 |
| 30 | Q8QZR5 | 2.7.1.11 |
| 31 | Q3TZM9 | 2.7.10.1 |
| 32 | Q8VDB2 | 2.7.1.11 |
| 33 | Q9D8C3 | 2.7.7.7 |
| 34 | Q921Q3 | 2.7.7.7 |
| 35 | Q9DBE8 | 2.7.7.7 |
| 36 | Q8K2A8 | 2.7.1.158 |
| 37 | Q9DB25 | 2.7.7.7 |
| 38 | Q3TAE8 | 2.7.10.1 |
| 39 | Q8VDI9 | 2.7.1.11 |
| 40 | Q6P8H8 | 2.7.10.1 |
| 41 | Q80Y20 | 2.7.1.158 |
| 42 | P97793 | 2.7.10.1 |
| 43 | Q91ZB0 | 2.7.7.7 |
| 44 | Q8BZ25 | 2.7.1.158 |
| 45 | Q3U3W5 | 2.7.10.1 |
| 46 | Q9JIF0 | 2.7.7.7 |
| 47 | Q922H1 | 2.7.7.7 |
| 48 | Q9R144 | 2.7.7.7 |
| 49 | Q8CIG8 | 2.7.1.158 |
| 50 | Q6NZB1 | 2.7.10.1 |
| 51 | Q922X9 | 2.7.7.7 |
| 52 | Q6PAK3 | 2.7.10.1 |
| 53 | P04627 | 2.7.11.1 |
| 54 | P50296 | 2.3.1.75 |
| 55 | Q91WU5 | 2.7.1.11 |
| 56 | Q99MY8 | 2.7.7.7 |
| 57 | D3KU66 | 2.3.1.- |
| 58 | D3KU67 | 2.3.1.- |
| 59 | Q8K341 | 2.7.1.158 |
| 60 | Q9Z2A5 | 2.7.7.7 |
| 61 | P16951 | 2.7.11.1 |
| 62 | Q62388 | 2.7.10.1 |
| 63 | Q9JKK8 | 2.7.7.7 |
| 64 | Q8QZR1 | 2.7.1.11 |
| 65 | O88445 | 2.3.1.- |
| 66 | O70126 | 2.3.1.- |
| 67 | P27038 | 2.7.11.1 |
| 68 | P27040 | 2.7.11.1 |
| 69 | Q6E1M8 | 2.7.10.1 |
| 70 | A2ADU9 | 2.3.1.75 |
| 71 | Q9CW73 | 2.7.7.7 |
| 72 | P59270 | 2.7.10.1 |
| 73 | P58158 | 2.7.10.1 |
| 74 | Q920V1 | 2.7.7.7 |
| 75 | Q8BG28 | 2.7.1.158 |
| 76 | Q8BHT6 | 2.7.1.158 |
| 77 | Q8BWP8 | 2.7.1.158 |
| 78 | Q5JCS9 | 2.7.10.1 |
| 79 | Q9Z222 | 2.7.7.7 |
| 80 | Q8BGY6 | 2.7.1.158 |
| 81 | Q1RLK6 | 2.7.10.1 |
| 82 | Q8VI16 | 2.7.1.11 |
| 83 | Q8R3I9 | 2.7.1.11 |
| 84 | O54904 | 2.3.1.- |
| 85 | Q8K0J2 | 2.7.1.158 |
| 86 | Q9Z0F0 | 2.7.7.7 |
| 87 | O54905 | 2.3.1.- |
| 88 | Q91Z92 | 2.7.7.7 |
| 89 | Q9JI67 | 2.7.7.7 |
| 90 | P15535 | 2.7.11.1 |
| 91 | Q6L8S8 | 2.7.10.1 |
| 92 | Q8R087 | 2.7.1.11 |
| 93 | Q91X34 | 2.7.1.11 |
| 94 | Q9Z277 | 2.7.7.7 |
| 95 | P24288 | 2.7.11.1 |
| 96 | O35855 | 2.3.1.- |
| 97 | Q6PAJ1 | 2.7.10.1 |
| 98 | P38649 | 2.7.11.1 |
| 99 | O35490 | 2.3.1.- |
| 100 | P36898 | 2.7.11.1 |
Что из таблиц видно, но непонятно - это наличие в верхней части списка EC 2.7.10.1 (рецептор протеин-тирозин киназы, ATP + a [protein]-L-tyrosine = ADP + a [protein]-L-tyrosine phosphate), EC 2.7.7.7 (ДНК-зависимая ДНК-полимераза, deoxynucleoside triphosphate + DNAn = diphosphate + DNAn+1), EC 2.7.4.21 (инозитол-гексакисфосфат киназа, ATP + 1D-myo-inositol hexakisphosphate = ADP + 1D-myo-inositol 5-diphosphate 1,2,3,4,6-pentakisphosphate), EC 2.7.11.1 (неспецифичная серин-треонин киназа, ATP + a protein = ADP + a phosphoprotein). Находки с номерами 2.3.1. не проходят по длине выравнивания (на мой взгляд, выравнивания слишком короткие, чтобы предсказывать гомологию).