Практикум 11. Гомология и выравнивание

1. Выбор семейства доменов из Pfam для анализа

Выбор осуществялся только исходя из минимальных ограничений к домену.

2. Описание семейства доменов

  • Название:Каталитический субдомен порфираназы 1 (Porphyranase catalytic subdomain 1)
  • ID:Porphyrn_cat_1
  • AC:PF18206
  • Функция:Этот домен, который был обнаружен уBacteroides plebeius составляет часть каталитического домена белка порфираназы. Порфираназа расщепляет порфирин во время переваривания гликанов красных морских водорослей. Стоит отметить, что гликаны красных морских водорослей содержат сульфатные эфиры, которые отсутствуют в наземных растениях.
  • Общее число последовательностей (full):199
  • Число последовательностей в выравнивании (seed):38
  • Число доменных архитектур с доменом:41
  • Наиболее представленные доменные архитектуры(2):W7QFP9_9ALTE (85 белков) и A0A495EBQ2_9FLAO (38 белков).
  • 3D-структуры:6
  • Таксономия: Этот домен встречается только у бактерий. У Proteobacteria 22 белка у 10 штаммов, у Bacteroidetes56 белков у 19 штаммов, у Planctomycetes 3 белка у 2 штаммов и у Firmicutes 13 белков у 2 штаммов
  • Профиль выравнивания:Был создан в феврале 2015 года, в нем 105 позиций

3. Построение карты локального сходства (Dot Plot) двух белков с доменом семейства, но с разной доменной архитектурой

Для сравнения были выбранны 2 белка с наиболее распространенными архитектурами: W7QFP9_9ALTE (Porphyrn_cat_1, BPA_C) и A0A495EBQ2_9FLAO (Porphyrn_cat_1, BPA_C, Por_Secre_tail).

Рис.1 E-value = 0,05. Значительных различий не видно.
Рис.1 E-value =100. Можно заметить дупликации нескольких коротких участков.

4. Выделение в выравнивании доменов семейства на основании сходства двух подгруппы доменов Pfam

Проект Jalview

1 группа (фиолетовый цвет)

  1. DIQV 1..4
  2. VDG 8..10
  3. K.Y 12..14
  4. NNL 18..20
  5. L 29
  6. L 47
  7. P 57
  8. TL 73..74
  9. T 79
  10. LEY 82..84
  11. E 98
  12. KYYA 100..103
  13. YLQ 106..108

2 группа (розовый цвет)

  1. DLQVR.FV 1..8
  2. FL 14..15
  3. NNQS 19..22
  4. E 26
  5. GI 36..37
  6. RR.G 45..48
  7. RN 51..52
  8. DF 54..55
  9. E 62
  10. T 64
  11. TP 67..68
  12. TL 71..72
  13. AGRE 75..78
  14. A 84
  15. I 90
  16. VNE 96..98
  17. CY.D 101..104
  18. Q 109

5. Таблица со всеми белками из Uniprot с доменом семейства Pfam

Ссылка на таблицу в формате excel со всеми необходимыми столбцами