1. Выбор семейства доменов из Pfam для анализа
Семейство доменов LPD18(PF18832) было выбрано случайно. Оно удовлетворяет всем ограничениям.
2. Описание семейства доменов
Характеристика:
ID: DR2241
AC: PF18069
Функция: стабилизация тетрамера
Число всех последовательностей: 144
Число последовательностей в выравнивании: 25
Число доменных архитектур с этим доменом: 6
Две достаточно представленные доменные архитектуры: DR2241, Fer4_23(107); CbiX x 2, DR2241, Fer4_23(30)
Число разных белков с доменом семейства, для которых известна 3D структура: 1
Число белков с доменом по таксонам: этот домен втречается в белках Архей (99) и Бактерий(44).
Дата создания HMM профиля: февраль 2015
Число позиций HMM профиля: 111
3. Построение карты локального сходства
Рис. 1: Карта локального сходства белков V4Y4N4_9ARCH и A0A2Z3JH74_9DEIO
По результату выравнивания двух белков с доменными архитектурами DR2241, Fer4_23 и CbiX x 2, DR2241, Fer4_23 можно предположить наличие предположить наличие 4 вставок или делеций. Самая большая размером в 30 аминокислот.
4. Выделение двух подгрупп доменов Pfam на основании сходства в выравнивании доменов семейства
Для сравнения было выбрано пять групп, объединенных по совпадениям в интервалах 130-134 и 142 - 150.
Совпадают у всех групп позоции 1,5,15,21,24,26,33,51,86,95-96,105,116,119-120,125,134,139-142,145-146.
Ссылки на изначальное выравнивание и выравние выбранных групп.
Таблица 1: Различия
Позиция | 1 Группа | 2 Группа | 3 Группа | 4 Группа | 5 Группа | 6 Группа |
---|---|---|---|---|---|---|
19 | R | R | A | R | R | R |
20 | E/T | E | S | E/Q | E | E |
28 | I | I | I | I | I | V |
33 | T | T | D | T | T | T |
50 | D | D/P | D | N | D | D |
67 | D | D | T | D | E | E |
93 | R | R | L | R | F | L |
127 | G | G | G | G | A | G |
131 | V | V | A | V | Y | V |
132 | D | E | E | E | E | R |
133 | A | T | T | T | A | T |
150 | R | L | R | L | Q | R |
5. Таблица с белками из Uniprot с доменом DR2241