Работа с базой данных Pfam

1.Исследование доменной структуры белка ADIA_ECOLI

1.1

Доменная структура белка ADIA_ECOLI по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства домена Положение в последовательности белка ADIA_ECOLI Клан
1. PF03709 OKR_DC_1_N

Пиридоксаль-5'фосфат-зависимые декарбоксилазы, действующие на орнитин, лизин, аргинин.
Домен носит название "крыло" из-за своей локализации в последовательности.
N-концевой домен.
Справка:L-орнитин-заменимая некодируемая аминокислота.В организме играет важную роль, особенно в биосинтезе мочевины

16-134

Клан CheY (CL0304),
содержит 3 семейства :
FleQ;OKR_DC_1_N;Response_reg

2. PF01276 OKR_DC_1

Пиридоксаль-зависимые декарбоксилазы, действующие на орнитин, лизин, аргинин.
Содержит остатки лизина,которые служат местом прикрепления пиридоксаль-фосфатной группы.
Главный домен.

140-590 Клан PLP_aminotran (CL0061),
содержит 14 семейств.
3. PF03711 OKR_DC_1_C Пиридоксаль-зависимые декарбоксилазы, действующие на орнитин, лизин, аргинин.
С-концевой домен.
Содержит остатки лизина,которые служат местом прикрепления пиридоксаль-фосфатной группы.
615-747 информация отсутствует.

1.2 PF03709_seed.msf

 

1.3 На мой запрос БД InterPro предложила 10 вариантов подписей.

Таблица данных о полученных находках

№ находки AD AC БД Положение в последовательности Содержание
1
IPR000310
PF01276
Pfam
140 - 589
Запись о главном домене OKR_DC_1
2
IPR000310 PS00703

ExPASy;
Prosite

381 - 395
Информация об организации главного домена,функциональных сайтах;содержит паттерн.
3
IPR005308 PF03709
Pfam
18 - 134
Запись об N -концевом домене OKR_DC_1_N
4
IPR008286

G3DSA:3.90.100.10
CATH
640 - 741
Информация о вторичной структуре C -концевого домена.
5
IPR008286 PF03711
Pfam
615 - 743
Запись о C -концевом домене
6
IPR008286 SSF55904
Superfamily
609 - 755
Информация об организации C -концевом домена,о последовательности,о вторичной структуре,мотивах...
7
IPR011193 PIRSF009393
PIR
1 - 755
Информация о последовательности,ою организации домена.
8
IPR015421 G3DSA:3.40.640.10
CATH
140 - 446
Информация о вторичной структуре главного домена.(1 субъединица)
9
IPR015422
G3DSA:3.90.1150.10
CATH
447 - 639
Информация о вторичной структуре главного домена.(2 субъединица)
10
IPR015424

SSF53383
Superfamily
140 - 608
Информация о главном домене PLP-зависимых трансфераз.
 SCOP и CATH - БД для анализа связи "структура - функция",которые использует алгоритмы, главной задачей которых являетсяпоиск гомологов по пространственной структуре.

Наиболее отличающейся от Pfam подписью на мой взгляд является находка под номером 2 - Prosite - так как она содержит

информацию о главном домене,но мало чем похожую на ту,которую мы найдём в подписи Pfam. Даже сравнив

месторасположения главного домена двух соответствующих подписей,мы увидим,что в находке под номером 2 находится его лишь

незначительная часть. Вероятнее всего указан сайт декарбоксилирования,характерный для всего семейства.

Таким образом, Prosite и Pfam выдают нам различную информацию о первичной структуре белка:

 

1.4

3D структура белка ADIA_ECOLI :

PDB ID : 2VYC 

На мой взгляд, лишь зелёный фрагмент может являться структурным доменом,так как он компактно свёрнут, воспринимается как

единая структура. Совпадает ли он полностью с доменом OKR_DC_1_N Pfam? Думаю,что примерно процентов на 98,так как по

краям альфа спиралей мы видим,что OKR_DC_1_N не полностью покрывает структурный домен.

2. Исследование эволюции отдельных доменов

2.1

Представленность домена OKR_DC_1_N в организмах разных видов

 
Таксон
Количество белков с доменом OKR_DC_1_N.
Эукариоты Зеленые растения нет
Грибы нет
Животные  2 ( Amoebozoa)
Остальные эукариоты Кроме 2ух из Amoebozoa не встречалось
Бактерии  794
Археи  2 ( Euryarchaeota )

Представленность домена OKR_DC_1 в организмах разных видов

 
Таксон
Количество белков с доменом OKR_DC_1.
Эукариоты Зеленые растения 1
Грибы нет
Животные 13
Остальные эукариоты 15
Бактерии  1458
Археи  5 ( Euryarchaeota )

Представленность домена OKR_DC_1_С в организмах разных видов

 
Таксон
Количество белков с доменом OKR_DC_1_С.
Эукариоты Зеленые растения 1 ( Chlamydomonas reinhardtii )
Грибы нет
Животные  9
Остальные эукариоты 14
Бактерии  1419
Археи 5 ( Euryarchaeota )

Как видно из этих трёх таблиц ни один из доменов не встречается в грибах,достаточно редко в растения и животных.Археи тоже не

выделяются,чего нельзя сказать о бактериях. На самом деле мне трудно объяснить такой расклад данных,потому что процессы

декарбоксилирования аргинина,орнитина,лизина являются очень важными в метаболизме эукариотических организмов. Видно эти

процессы в эукариотических организмах контролируются другим спектром доменов и соответственно белков.

Самым редким по встречаемости в природе оказался домен OKR_DC_1_N.

2.2

    Представленность изучаемых доменов в белкахEscherichia coli (strain K12)
    PFAM ID Количество белков в Escherichia coli (strain K12)
    1.  OKR_DC_1_N
     5
     2.  OKR_DC_1
     3.  OKR_DC_1_C

    Хотелось бы отметить,что информация,выдаваемая Pfam полностью идентична в случае всех трёх доменов.Идентична!

    Думаю,что из этого следует,что у Escherichia coli (strain K12) встречается 5 различных белков с одинаковой доменнной

    организацией. Таким образом, функция декарбоксилирования орнитина,лизина и аргинина очень важна для бактерий,раз

    требует такого количества однотипных белков (одной доменной организации) .

    2.3 Примеры разных доменных перестроек

    Домен OKR_DC_1_N :домен встречается как в полной,так и в виде частичной последовательности; как один, так и в сочетании с другими доменами.

    Домен OKR_DC_1 :домен встречается как один, так и в сочетании с другими доменами:

    В процессе эволюции происходила дупликация части последовательности:

    Домен OKR_DC_1_С :домен встречается как один, так и в сочетании с другими доменами:

    2.3*

    Возьмём мой предыдущий белок ECOT_ECOLI.

    Его доменная организация такова:

    Причём она единственна!!!

    Как помнится, он является ингибитором серин-протеиназы. И как оказалось из дерева,то он встречается как у эукариот,так и

    у прокариот,причём у эукариот лишь в двух организмах : Leishmania и Trypanosoma!Милый белочек!=)

    А вот его изображение:

    Можно сказать,что структурный домен совпадает с предполагаемым доменом Pfam. Из структуры видно,что домен ecotin

    представляет собой гомодимерный комплекс. ECOT_ECOLI - белок бета-типа.


    ©Терешкова Алеся,2010e