Гомология и выравнивание

1 Выбор семейства доменов из Pfam для анализа

Случайным образом для анализа было выбрано семейство CD4-extracel (PF09191), удовлетворяющее всем ограничениям.

2 Описание семейства доменов

Характеристика семейства доменов:

ID доена:

AC домена:

Функция домена:




Число всех последовательностей:

Число последовательностей в выравнивании:

Число доменных архитектур с этим доменом:

Две достаточно представленные доменные архитектуры:


Число разных белков с доменом семейства, для которых известна 3D структура:

Число белков с доменом по таксонам:




Дата создания HMM профиля:

Число позиций HMM профиля:

CD4-extracel

PF09191

корецептор для Т-клеточного рецептора на поверхности Т-хелперов, взаимодействует с лимфоцит-специфической протеин тирозин киназой

171

20

16

ig, C2-set, CD4-extracel, C2-set, Tcell_CD4_C (85 белков)
ig, C2-set, CD4-extracel, C2-set (35 белков)


2

в надцарстве Эукариоты, царстве Животные, типе Ходовые 137 белков, из них в классе Птицы — 20 белков, в классе Млекопитающие — 112 белков

Февраль 2015

107

3 Построение карты локального сходства (Dot Plot)

Карта локального сходства
Рис. 1. Карта локального сходства белков CD4_CANLF и S9XJK8_CAMFR.

По результату выравнивания двух белков с доменными архитектурами ig, C2-set, CD4-extracel, C2-set, Tcell_CD4_C и ig, C2-set, CD4-extracel, C2-set можно предположить наличие нескольких маленьких вставок или делеций и одной большой, длинной в 9 аминокилотных остатков.

4 Выделение двух подгрупп доменов Pfam на основании сходства в выравнивании доменов семейства

Для выделения двух подгрупп использовано выравнивание всех последовательностей (full), из которого удалены последовательности, совпадающие более чем на 90%. В результате чего осталось 66 последовательностей. Далее было построено филогенетическое дерево белков выравнивания, на основании которого выделено четыре подгруппы. Для сравнения взяты Группа 1 и Группа 2, окрашенные в проекте Jalview (скачать) в фиолетовый и красный цвет соответственно.

В этих группах имеются как позиции консервативные для обеих групп одновременно, так и позиции консервативные только в пределах группы. Эти позиции привидены в Таблице 1. В целом последовательности из Группы 2 более идентичны между собой, чем последовательности из Группы 1.

Таблица 1. Различия в консервативных участках последовательностей из разных групп.
Позиция   выравнивания Группа 1 Группа 2       Позиция выравнивания Группа 1 Группа 2
15 G D 120 A S
16 E S 122 S Q
20 F или L L 123 G Y
22 F W 125 L C
35 L W 126 T Q
45 E Q 129 L Y
61 W L 138 L V или T
108 L I 142 V I
110 F или L V 143 N или K E
115 A или V V
120 A S

5 Сохранение таблицы со всеми белками из Uniprot с доменом семейства Pfam

Таблицу со всеми белками из Uniprot с доменом CD4-extracel можно скачать по ссылке.