Семестр 2. Практикум 11. Гомология и выравнивание. Домены. JalView

1. Выбор семейства белковых доменов

Из базы Pfam выбрано семейство белковых доменов со следующими характеристиками:

Домен удовлетворяет условиям задания: более 20 последовательностей в seed-выравнивании и не менее 3 структур.

2. Описание семейства доменов

Таблица 1. Формальные характеристики семейства PF00018

Параметр Информация Комментарии
AC pfamPF00018
ID pfamSH3_1
#SEED55
#All176 301 (Pfam 38.1)Proteins - All на InterPro
#SW585Proteins - Reviewed
#architectures4 795Domain architectures
#3D563Structures
#Eukaryota214 924 (3 684 вида)Taxonomy
#Archaea
#Bacteria67 (59 видов)
#Viruses30 (19 видов)

2.1. Функция и структура домена

SH3 (Src homology 3) — небольшой домен (~60 а.к.), впервые описанный в цитоплазматической тирозинкиназе Src (P12931). Домены SH3 характерны для белков, участвующих в передаче сигнала и организации цитоскелета. Структурно домен представляет собой частично открытую бета-бочку. SH3 домены, как правило, узнают пролин-богатые мотивы (PxxP) в белках-партнёрах, обеспечивая специфические белок-белковые взаимодействия в сигнальных каскадах.

2.2. Таксономическое распространение

Домен SH3_1 встречается преимущественно у эукариот: 214 924 белка в 3 684 видах. У бактерий представлен незначительно — 67 белков в 59 видах, у вирусов — 30 белков в 19 видах. У архей домен не обнаружен. Таким образом, SH3 — типично эукариотический домен.

Таксономическое распределение белков домена PF00018 с разной глубиной представлено на рисунках ниже.

Таксономия PF00018, sunburst 2 кольца

Рисунок 1а. Глубина - 2.

Таксономия PF00018, sunburst 7 колец

Рисунок 1б. Глубина - 7.

2.3. Доменные архитектуры

Домен SH3_1 встречается в 4 795 различных доменных архитектурах. Наиболее распространённые из них:

3. Анализ блоков выравнивания seed

Seed-выравнивание домена PF00018 загружено в JalView (File - Fetch sequences - PFAM Seed).

Таблица 2. Результаты анализа блоков выравнивания

Параметр Информация Комментарии
Выравнивание seed 55 последовательностей, 56 колонок
МДБ-all (колонки) 13–28 Абсолютно консервативных колонок нет; col 37 (W, 100%) находится вне блока — в блоке 37–43, который короче
100% консервативные колонки в МДБ-all 15:[DE] (89%), 22:[DE] (84%) Функциональная консервация группы кислых а.к.
МДБ-notAll (колонки, последовательности) 1–10, последовательности 1–54 Q6FWR1_CANGA/526-572 исключена — имеет гэп в col 1
100% консервативные колонки в МДБ-notAll 2:A (48/54, 89%), 4:[FY] (47/54, 87%), 6:[FY] (53/54, 98%)
Недостоверный участок (колонки) 33–35 Col 34 имеет букву только у 1 из 55 последовательностей (BOI2_YEAST), col 33 — только у 4

3.1. Максимальный достоверный блок, включающий все последовательности (МДБ-all)

Блок определён на колонках 13–28 (длина 16 позиций). В этом участке все 55 последовательностей представлены буквами — гэпов нет. Блок соответствует консервативному мотиву петли между первым и вторым бета-тяжами SH3 домена, включающей функционально важный участок связывания лиганда.

Консервативные позиции внутри блока:

Блок максимален: расширение влево (col 12: 91% гэпов) или вправо (col 29: 4 гэпа, неконсервативна) снижает его достоверность. Добавление любой последовательности невозможно — все 55 уже включены.

МДБ-all: колонки 13–28, все 55 последовательностей

Рисунок 2. Вид «МДБ-all». Колонки 15 и 22 соответствуют консервативной группе [DE].

3.2. Максимальный достоверный блок, включающий не все последовательности (МДБ-notAll)

Блок определён на колонках 1–10, подмножество из 54 последовательностей (последовательности 1–54; исключена Q6FWR1_CANGA/526-572, имеющая гэп в колонке 1). В этих 10 колонках у 54 последовательностей нет ни одного гэпа.

Консервативные позиции внутри блока (среди 54 последовательностей):

Этот блок соответствует N-концевой части домена SH3 — первому бета-тяжу и предшествующей петле с характерным мотивом xALYDY.

МДБ-notAll: колонки 1–10, 54 последовательности

Рисунок 3. Вид «МДБ-notAll».

3.3. Участок выравнивания, не отражающий ход эволюции

Колонки 33–35 не содержат ни одного достоверного подблока даже для пары последовательностей:

Недостоверный участок: колонки 33–35

Рисунок 4. Вид «Недостоверный»: во всех строках — гэпы, буквы присутствуют лишь у единичных последовательностей.

Проект JalView

4. Карта локального сходства двух белков с SH3-доменом

Таблица 3. Выбранные белки и их доменные архитектуры

Параметр Информация Комментарии
Доменная архитектура 1SH3_1 + SH2 + PK_Tyr_Ser-Thr
Белок с архитектурой 1P10447 — тирозинкиназа Src (репрезентативный белок)
Доменная архитектура 2BAR + SH3_1
Белок с архитектурой 2P39743 — белок эндоцитоза (репрезентативный белок)

Карта локального сходства (dotplot) построена с помощью NCBI BLASTp (Align two or more sequences - Dot Plot).

Dotplot P10447 vs P39743

Рисунок 5. Карта локального сходства (dotplot) белков P10447 и P39743. Единственная диагональ соответствует общему SH3-домену.

На карте обнаруживается единственная диагональ, что означает одну область локального сходства между двумя белками. Это и есть общий SH3-домен: именно он гомологичен в обеих последовательностях, тогда как остальные домены — SH2 и тирозинкиназный у P10447, BAR у P39743 — друг другу не гомологичны и на карте не отображаются.

В диагонали наблюдается разрыв — нормальная эволюционная вариация внутри доменного семейства.

Таким образом, несмотря на принципиально разный белковый контекст (сигнальная киназа vs. белок регуляции кривизны мембраны), SH3-домены обоих белков сохраняют гомологию, что подтверждает общее эволюционное происхождение домена вне зависимости от архитектуры содержащего его белка.

← К списку работ семестра