PFAM и Interpro



1. Описать доменную архитектуру данного белка в соответствии с банков Pfam.



Доменная структура белка RIDA_BACSU (YABJ_BACSU) по данным Pfam

Cхема из Pfam:
Пояснения к схеме
Pfam AC Pfam ID Полное название семейства доменов Положение в последовательности белка RIDA_BACSU Клан
1. PF01042 Ribonuc_L-PSP Эндоирбонуклеаза L-PSP. Она активна на одноцепочечной РНК и угнетает синтез белка при расщеплении мРНК (раньше думали, что ее функция - тормозить начало синтеза белка). Также она, возможно, участвует в регуляции биосинтеза пурина (что коррелирует с установленной функцией белка RIDA_BACSU). 7–124 -

2. Выберите один из доменов белка и приведите данные о его архитектурах, содержащих его белках и последовательностях.

  1. Домен входит в 51 архитектуру (в белке RIDA_BACSU - архитектура Ribonuc_L-PSP, то есть одиночный домен).

  2. Известны последовательности 8475 белков, содержащих этот домен.

  3. Пространственная структура определена для 16 разных белков, содержащих домен (или 92 структур вообще).

  4. В выравнивании можно увидеть, что белки достаточно похожи между собой, а многие из них даже попали в результаты прошлого задания с гомологичными белками, что не может не радовать. Выравнивание


3. Выберите доменную архитектуру с двумя разными доменами. Опишите, как часто и в каких организмах они встречаются по отдельности.


В моем белке этот домен единственный, соответственно, была найдена другая архитектура - ATP_bind_4, Ribonuc_L-PSP.


Представленность доменов PF01042 и PF13442 в организмах разных таксонов

Таксон
Количество белков с доменом PF01042.
Количество белков с доменом PF13442.
Эукариоты Зеленые растения 86 48
Грибы 488 2
Животные 138 3
Остальные эукариоты 84 36
Археи 87 3
Бактерии 7569 6594
Вирусы 0 0


Можно сделать вывод, что оба домена представлены чаще всего в бактериях, причем первый распространеннее второго, который у грибов, животных и архей встречается вообще в единичных случаях.


Сравните описание мотивов в разных банках семейств по данным InterPro.


  1. Самый короткий мотив - UPF0076 (18 остатков, 100 - 118), банк PROSITE pattern.

  2. Звание самого длинного мотива делят мотив Endoribon_LPSP (1 - 124, банк PANTHER) и мотив YjgF/chorismate_mutase-like (2-125, банк SuperFamily).

  3. Представлены следующие структурные подписи:

                 1qd9A     PDB Chain
                 1qd9B     PDB Chain	
                 1qd9C     PDB Chain
    3.30.1330.40 1qd9A00   CATH Domain
    d.79.1.1     d1qd9a_   SCOP Domain

  4. Границы домена PF01042 не изменились по сравнению с Pfam, все так же 7 - 124.