Информация о моем белке (зачетное задание №1).
Метка поля | Содержание | |
Код(ы) доступа ("Accession number") | AC | P77791; Q2MBW8 |
Идентификатор записи в БД | ID | MAA_ECOLI |
Название (краткое описание) белка | DE | RecName: Full=Maltose O-acetyltransferase; EC=2.3.1.79 AltName: Full=Maltose transacetylase |
Дата создания документа | DT | 01-NOV-1997 |
Дата последнего исправления аннотации | DT | 16-DEC-2008 |
Число публикаций, использованных при создании документа | RN | 6 |
Журнал и год самой поздней публикации | RL | Mol. Syst. Biol. 2:E1-E5(2006). |
Ключевые слова | KW | 3D-structure; Complete proteome; Direct protein sequencing; Repeat; Transferase. |
Что содержит поле комментариев? | CC |
Функция: ацетилирует мальтозу и другие сахара. Каталитическая активность: ацетил-CoA + мальтоза = CoA + ацетил-мальтоза Биофизические свойства: кинетические параметры: (Константа Михаэлиса) KM=62 mM для глюкозы; KM=90 mM для мальтозы; Vmax=0.20 ммоль/мин/мг фермент с глюкозой в основании; Vmax=0.11 ммоль/мин/мг фермент с мальтозой в основании; Примечания: ацителирует глюкозу, мальтозу, маннозу, галактозу с уменьшающейся относительной нормой: 1, 0.55, 0.20, 0.07, 0.04; Структура: гомодимер; Сходство: Принадлежит к семье гексапептидных трансфераз. |
Идентификаторы записей PDB | DR | 1OCX |
Запрос | Число записей в SwissProt |
Число записей в TrEMBL |
"Maltose O-acetyltransferase" | 2 | 262 |
"EC=2.3.1.79" | 2 | 194 |
"Maltose O-acetyltransferase (EC=2.3.1.79)" | 2 | 192 |
"Maltose transacetylase" | 2 | 40 |
Метка поля | P77791 | P37515 | |
Первый код доступа | AC | P77791 | P37515 |
Идентификатор последовательности в БД | ID | MAA_ECOLI | MAA_BACSU |
Название (краткое описание) белка | DE | RecName: Full=Maltose O-acetyltransferase; EC=2.3.1.79 | RecName: Full=Probable maltose O-acetyltransferase; EC=2.3.1.79 |
Дата создания документа | DT | 01-NOV-1997 | 01-OCT-1994 |
Дата последнего исправления аннотации | DT | 16-DEC-2008 | 20-JAN-2009 |
Название организма | OS | Escherichia coli (strain K12) | Bacillus subtilis |
Классификация организма (список таксонов) | OC | Bacteria › Proteobacteria › Gammaproteobacteria › Enterobacteriales › Enterobacteriaceae › Escherichia. | Bacteria › Firmicutes › Bacillales › Bacillaceae › Bacillus. |
Длина последовательности | SQ | 183 | 184 |
Молекулярная масса белка | SQ | 20,096 | 20,210 |
Число публикаций, использованных при создании документа | RN | 6 | 3 |
Журнал и год самой поздней публикации | RL | Mol. Syst. Biol. 2:E1-E5(2006) | Nature 390:249-256(1997) |
Описание вторичной структуры | FT | Да, большая часть структуры состоит из альфа-спиралей и бета-тяжей, 1 небольшой участок с бета-поворотом. | Нет. |
Ключевые слова | KW | 3D-structure; Complete proteome; Direct protein sequencing; Repeat; Transferase. | Complete proteome; Repeat; Transferase. |
Темы, освещённые в комментариях | CC | Каталитическая активность, биофизические свойства, функции, структура, сходство. | Каталитическая активность, сходство. |
Особенности последовательности | FT | Может отсутствовать 1-ая аминокислота - инициатор метеонина. | Вероятная мальтозо - ацетил-трансфераза.. |
Идентификаторы записей PDB | DR | 1K3P; 1NXE; 1NXG; 1OWB; 1OWC | 1431 |
ВЫВОД: Белок P77791 лучше исследован, известна его вторичная структура, точные функции и т.д., несмотря на то что первая публикация о белке P37515 появилась на 3 года раньше. Белки сходны по строению, так что, на основании исследований E.coli можно делать выводы о функционировании белка Bacillus subtilis.
. Наверх
Формулировка функции белка | Строка запроса | Количество найденных документов |
Transferase (трансферазы) |
([swissprot-Taxonomy:Gammaproteobacteria*] & [swissprot-Description:Transferase*]) |
1 850 |
Acetyltransferase (ацетил-трансферазы) |
([swissprot-Taxonomy:Gammaproteobacteria*] & [swissprot-Description:acetyltransferase*]) |
169 |
То же самое что и первый запрос, но поиск трансфераз по AllText а не по Discription |
([swissprot-Taxonomy:Gammaproteobacteria*] & [swissprot-AllText:Transferase*]) |
18 632 |
Поиск по ключевым словам |
((([swissprot-Taxonomy:Gammaproteobacteria*] & (([swissprot-Keywords:Complete*] & [swissprot-Keywords:proteome*]) | [swissprot-Keywords:Complete proteome*])) & ((([swissprot-Keywords:Direct*] & [swissprot-Keywords:protein*]) & [swissprot-Keywords:sequencin*]) | [swissprot-Keywords:Direct protein sequencin*])) & [swissprot-Keywords:Transferase*]) |
185 |
maa_ecoli 92 -CPIRIGDNCMLAPGVHIYTATH------------PIDPVARNSGAELGK 128Удвоенные:
capg_staau 43 PYLIQIGNHVTITSGVKF--ATHDGGVWIFRKKYPEIDNFHR-------- 82
maa_ecoli 101 MLAPGVHIYTATHPIDPVARNSGAELGKP----------VTIGNNVWIGG 140
capg_staau 44 YLIQIGNHVTITSGVKFATHDGGVWIFRKKYPEIDNFHRIFIGNNVFIGI 93
maa_ecoli 76 LGNNFFANFDCVMLDV---------CPIRIGDNCMLAPGVHIYTATH--- 113
capg_staau 25 VGN------DCRFLSVDRSTFGSEPYLIQIGNHVTITSGVKF--ATHDGG 66
maa_ecoli 92 CPIRIGDNCMLAPGVHIYTATHP-IDPVARNSGAELGKPVTIGNNVWIGG 140
capg_staau 65 -----G-------GVWIFRKKYPEIDNFHR---------IFIGNNVFIGI 93
Поиск по БД Swiss-Prot | Поиск по БД PDB | Поиск по БД "nr" | |
1. Лучшая находка (в принципе должна соответствовать заданному белку) | |||
Идентификатор БД | MAA_ECOLI (соответствует моему белку) | 1OCX (соответствует моему белку) | NP_414992(соответствует моему белку) |
E-value | 3e-105 | 2e-105 | 4e-104 |
Вес (в битах) | 379 | 377 | 379 |
% идентичности | 100 | 100 | 100 |
Найдены ли другие белки с теми же значениями E-value и веса в битах? | нет | нет | да, один: ref|YP_001742603.1| (вес=379, E-value=8e-104) |
2. Сколько хороших кандидатов в гомологи найдено? | 15 | 5 | 100 |
2. "Худшая" находка (последняя в выдаче с E-value < 1) | |||
Номер находки в списке описаний (Descriptions) | 102 | 29 | 102 |
Идентификатор БД | SAT4_ARATH | 3FWW | ZP_04097469 |
E-value | 0.001 | 0,74 | 3e-64 |
Вес (в битах) | 42.7 | 29,3 | 247 |
% идентичности | 38 | 31 | 63 |
% сходства | 60 | 60 | 77 |
Длина выравнивания | 60 | 41 | 182 |
Координаты выравнивания (номера первых и последних а.о.) (query - заданный; sbjct - сравниваемый) | 122,180;249,308 | 132,172;397,437 | 1,180;16,192 |
% гэпов | 1 | 0 | 1 |
Homo sapiens (taxid:9606) | |||
Идентификатор БД | EDEM2_HUMAN | 2R8U | NP_001138497| |
Номер находки в списке описаний (Descriptions) | 1 | 1 | 1 |
E-value | 1.1 | 0.38 | 4.1 |
Вес (в битах) | 29.6 | 28.1 | 30.0 |
% идентичности | 28 | 21 | 28 |
% сходства | 42 | 39 | 42 |
Длина выравнивания | 115 | 119 | 126 |
Координаты выравнивания (номера первых и последних а.о.) (query - заданный; sbjct - сравниваемый) | 13,119;380,484 | 34,144;62,180 | 13,119;343,447 |
% гэпов | 17 | 9 | 17 |
Поиск по фрагменту | Поиск по полной последовательности |
|
АС лучшей находки | MAA_BACSU | MAA_BACSU |
E-value | 3e-13 | 3e-105 |
Вес (в битах) | 71.9 | 380 |
Найдены ли другие белки с теми же значениями E-value и веса в битах? |
нет, у остальных - вес гораздо меньше, а E-value больше | нет, тот же результат |
MAA_BACSU 2 LRTEKEKMAAGELYNSEDQQLLLERKHARQLIRQYNET-PEDDAVRTKLLKELLGSVGDQ 60 MAA_ECOLI 1 MSTEKEKMIAGELYRSADETLSRDRLRARQLIHRYNHSLAEEHTLRQQILADLFGQV-TE 59 MAA_BACSU 61 VTILPTFRCDYGYHIHIGDHTFVNFDCVILDVCEVRIGCHCLIAPGVHIYTAGHPLDPIE 120 MAA_ECOLI 60 AYIEPTFRCDYGYNIFLGNNFFANFDCVMLDVCPIRIGDNCMLAPGVHIYTATHPIDPVA 119 MAA_BACSU 121 RKSGKEFGKPVTIGDQVWIGGRAVINPGVTIGDNAVIASGSVVTKDVPANTVVGGNPARI 180 MAA_ECOLI 120 RNSGAELGKPVTIGNNVWIGGRAVINPGVTIGDNVVVASGAVVTKDVPDNVVVGGNPARI 179 MAA_BACSU 181 LKQL 184 MAA_ECOLI 180 IKKL 183NEEDLE:
MAA_BACSU 1 MLRTEKEKMAAGELYNSEDQQLLLERKHARQLIRQYNET-PEDDAVRTKL 49 MAA_ECOLI 1 MSTEKEKMIAGELYRSADETLSRDRLRARQLIHRYNHSLAEEHTLRQQI 49 MAA_BACSU 50 LKELLGSVGDQVTILPTFRCDYGYHIHIGDHTFVNFDCVILDVCEVRIGC 99 MAA_ECOLI 50 LADLFGQV-TEAYIEPTFRCDYGYNIFLGNNFFANFDCVMLDVCPIRIGD 98 MAA_BACSU 100 HCLIAPGVHIYTAGHPLDPIERKSGKEFGKPVTIGDQVWIGGRAVINPGV 149 MAA_ECOLI 99 NCMLAPGVHIYTATHPIDPVARNSGAELGKPVTIGNNVWIGGRAVINPGV 148 MAA_BACSU 150 TIGDNAVIASGSVVTKDVPANTVVGGNPARILKQL 184 MAA_ECOLI 149 TIGDNVVVASGAVVTKDVPDNVVVGGNPARIIKKL 183WATER:
MAA_BACSU 2 LRTEKEKMAAGELYNSEDQQLLLERKHARQLIRQYNET-PEDDAVRTKLLKELLGSVGDQ 60 MAA_ECOLI 1 MSTEKEKMIAGELYRSADETLSRDRLRARQLIHRYNHSLAEEHTLRQQILADLFGQV-TE 59 MAA_BACSU 61 VTILPTFRCDYGYHIHIGDHTFVNFDCVILDVCEVRIGCHCLIAPGVHIYTAGHPLDPIE 120 MAA_ECOLI 60 AYIEPTFRCDYGYNIFLGNNFFANFDCVMLDVCPIRIGDNCMLAPGVHIYTATHPIDPVA 119 MAA_BACSU 121 RKSGKEFGKPVTIGDQVWIGGRAVINPGVTIGDNAVIASGSVVTKDVPANTVVGGNPARI 180 MAA_ECOLI 120 RNSGAELGKPVTIGNNVWIGGRAVINPGVTIGDNVVVASGAVVTKDVPDNVVVGGNPARI 179 MAA_BACSU 181 LKQL 184 MAA_ECOLI 180 IKKL 183
Рассмотрим наш фрагмент множественного выравнивания.
Создаём 3 паттерна.
Проведу поиск последовательностей банка Swiss-Prot, включающих мотивы, соответствующие каждому из полученных паттернов.
Таблица результатов поиска по паттернам в базе данных SwissProt:
Характеристика паттерна | Паттерн | В скольких последовательностях банка Swiss-Prot найден мотив, удовлетворяющий паттерну? | Все ли последовательности из Вашего выравнивания найдены? |
Фрагмент последовательности | RYLFPDRDDV | в 1 | Нет |
Сильный | [RKAND]-[YNH]-[LFVAT]-[FY]-[PAVM] -[DN]-[RFS]-[DN]-X(0,4)-D-[VDG] | в 7 | Все |
Слабый | [FY]-[PAVM]-{A}-[RFS]-[DN]-X(0,4)-D-[VDG] | в 1003 | Все |
Первый паттерн - это фрагмент последовательности моего белка MAA_ECOLI, а те последовательности, которые имеют гэпы или не совпадают, нам не подходят. Второй, более сильный паттерн, одновременно и более мягкий, он нашел все последовательности. Самый мягкий паттерн (слабый) выявил большое количество последовательностей белков, не только из семейств моего белка, но и из других таксонов. Из всего этого можно сделать вывод - самый оптимальный паттерн - сильный, так как он находит нужное нам число последовательностей белка, и по возможности не находит лишние белки.
Идентификатор документа PROSITE (AC) | Название мотива | Краткое описание мотива | Тип подписи (паттерн, профиль) | Паттерн (регулярное выражение) | Специфична ли подпись? | Сколько мотивов нашлось в белке? |
PS00101 | HEXAPEP_TRANSFERASES | Сайт повторяющихся гексапептидов, содержащих трансферазы | паттерн | [LIV] - [GAED] - x(2) - [STAV] - x - [LIV] - x(3) - [LIVAC] - x - [LIV] - [GAED] - x(2) - [STAVR] - x - [LIV] - [GAED] - x(2) - [STAV] - x - [LIV] - x(3) - [LIV] | специфична | 1 |
PS00005 | PKC_PHOSPHO_SITE | Сайт фосфорилирования казеинкиназы С | паттерн | [ST] - x - [RK] | неспецифична | 3 |
PS00006 | CK2_PHOSPHO_SITE | Сайт фосфорилирования казеинкиназы II | паттерн | [ST] - x(2) - [DE] | неспецифична | 5 |
PS00008 | MYRISTYL | Сайт N-миристоилирования | паттерн | G - {EDRKHPFYW} - x(2) - [STAGCN] - {P} | неспецифична | 4 |
PS00001 | ASN_GLYCOSYLATION | Сайт N-гликолизации | паттерн | N - {P} - [ST] - {P} | неспецифична | 1 |
Задание 1Проведём работу с четырьмя аминокислотными последовательностями. Первые три последовательности имеют в Swiss-Prot номера доступа P18196, P0A832, P0A780; четвёртая – последовательность моего белка (MAA_ECOLI).Для этих последовательностей проводим итеративный поиск по банку Swiss-Prot программой PSI-BLAST. При поиске всем параметрам (кроме банка поиска и программы) оставляем значения по умолчанию. Выполняем до пяти итераций, пока появляются новые последовательности выше порога 0,005 на E-value; если же и после пятой итерации список не стабилизировался, можно на этом остановиться.
Выводы: MINC_ECOLI "разошелся", т.к. даже после 5-й итерации список не стабилизировался, т.е. продолжали появляться новые находки, размывающие результат. SSRP_ECOLI и NUSB_ECOLI "сошлись": в первом случае вторая итерация выдала нам столько же находок, сколько и первая, и новых находок не появилось, поэтому мы можем сразу утверждать, что белок "сходится". Во втором случае новые находки перестали появляться после 4-ой итерации. Мой белок также "разошелся", т.к и после 5-ой итерации BLAST продолжал находить новые белки. В случае с последовательностями, которые "сошлись", E-value худшей находки выше порога резко уменьшался с каждой последующей итерацией, E-value лучшей находки ниже порога независимо от итераций мог увеличиваться или уменьшаться. Разрыв между лучшей и худшей находкой увеличивался с каждым разом. У разошедшихся последовательностей, E-value в обоих случаях менялся незначительно, и, при увеличении числа находок, разрыв между лучшей и худшей находками также менялся очень незначительно. Это может говорить о "расхождении" списка гомологов. Задание 2"Не сошлись" интерации для белка MINC_ECOLI. Проведём опять поиск, изменив порог с 0.005 на 0.001.С таким параметром порога третья итерация "сошлась", вследствие того, что белок, размывающий результат, и , вероятно, негомологичный заданной последовательности, на этот раз не попал в список. Если увеличить порог до 0.002, то он опять попадет в список. Таким образом, снижение порога E-value можно использовать для улучшения результата поиска при "расхождении" белка. |