Из базы Pfam выбрано семейство белковых доменов со следующими характеристиками:
PF00018SH3_1Домен удовлетворяет условиям задания: более 20 последовательностей в seed-выравнивании и не менее 3 структур.
Таблица 1. Формальные характеристики семейства PF00018
| Параметр | Информация | Комментарии |
|---|---|---|
| AC pfam | PF00018 | |
| ID pfam | SH3_1 | |
| #SEED | 55 | |
| #All | 176 301 (Pfam 38.1) | Proteins - All на InterPro |
| #SW | 585 | Proteins - Reviewed |
| #architectures | 4 795 | Domain architectures |
| #3D | 563 | Structures |
| #Eukaryota | 214 924 (3 684 вида) | Taxonomy |
| #Archaea | — | |
| #Bacteria | 67 (59 видов) | |
| #Viruses | 30 (19 видов) |
SH3 (Src homology 3) — небольшой домен (~60 а.к.), впервые описанный в цитоплазматической тирозинкиназе Src (P12931). Домены SH3 характерны для белков, участвующих в передаче сигнала и организации цитоскелета. Структурно домен представляет собой частично открытую бета-бочку. SH3 домены, как правило, узнают пролин-богатые мотивы (PxxP) в белках-партнёрах, обеспечивая специфические белок-белковые взаимодействия в сигнальных каскадах.
Домен SH3_1 встречается преимущественно у эукариот: 214 924 белка в 3 684 видах. У бактерий представлен незначительно — 67 белков в 59 видах, у вирусов — 30 белков в 19 видах. У архей домен не обнаружен. Таким образом, SH3 — типично эукариотический домен.
Таксономическое распределение белков домена PF00018 с разной глубиной представлено на рисунках ниже.
Рисунок 1а. Глубина - 2.
Рисунок 1б. Глубина - 7.
Домен SH3_1 встречается в 4 795 различных доменных архитектурах. Наиболее распространённые из них:
SH3_1 + SH2 + PK_Tyr_Ser-Thr — 16 108 белков (пример: P10447); типичная архитектура тирозинкиназ семейства SrcSH3_1 — 15 993 белка (пример: P40073); домен как единственный структурный элементBAR + SH3_1 — 7 406 белков (пример: P39743); белки, связанные с изгибом мембраны и эндоцитозомSeed-выравнивание домена PF00018 загружено в JalView (File - Fetch sequences - PFAM Seed).
Таблица 2. Результаты анализа блоков выравнивания
| Параметр | Информация | Комментарии |
|---|---|---|
| Выравнивание seed | 55 последовательностей, 56 колонок | |
| МДБ-all (колонки) | 13–28 | Абсолютно консервативных колонок нет; col 37 (W, 100%) находится вне блока — в блоке 37–43, который короче |
| 100% консервативные колонки в МДБ-all | 15:[DE] (89%), 22:[DE] (84%) | Функциональная консервация группы кислых а.к. |
| МДБ-notAll (колонки, последовательности) | 1–10, последовательности 1–54 | Q6FWR1_CANGA/526-572 исключена — имеет гэп в col 1 |
| 100% консервативные колонки в МДБ-notAll | 2:A (48/54, 89%), 4:[FY] (47/54, 87%), 6:[FY] (53/54, 98%) | |
| Недостоверный участок (колонки) | 33–35 | Col 34 имеет букву только у 1 из 55 последовательностей (BOI2_YEAST), col 33 — только у 4 |
Блок определён на колонках 13–28 (длина 16 позиций). В этом участке все 55 последовательностей представлены буквами — гэпов нет. Блок соответствует консервативному мотиву петли между первым и вторым бета-тяжами SH3 домена, включающей функционально важный участок связывания лиганда.
Консервативные позиции внутри блока:
Блок максимален: расширение влево (col 12: 91% гэпов) или вправо (col 29: 4 гэпа, неконсервативна) снижает его достоверность. Добавление любой последовательности невозможно — все 55 уже включены.
Рисунок 2. Вид «МДБ-all». Колонки 15 и 22 соответствуют консервативной группе [DE].
Блок определён на колонках 1–10, подмножество из 54 последовательностей (последовательности 1–54; исключена Q6FWR1_CANGA/526-572, имеющая гэп в колонке 1). В этих 10 колонках у 54 последовательностей нет ни одного гэпа.
Консервативные позиции внутри блока (среди 54 последовательностей):
Этот блок соответствует N-концевой части домена SH3 — первому бета-тяжу и предшествующей петле с характерным мотивом xALYDY.
Рисунок 3. Вид «МДБ-notAll».
Колонки 33–35 не содержат ни одного достоверного подблока даже для пары последовательностей:
BOI2_YEAST/49-99
Рисунок 4. Вид «Недостоверный»: во всех строках — гэпы, буквы присутствуют лишь у единичных последовательностей.
Проект JalView
Таблица 3. Выбранные белки и их доменные архитектуры
| Параметр | Информация | Комментарии |
|---|---|---|
| Доменная архитектура 1 | SH3_1 + SH2 + PK_Tyr_Ser-Thr | |
| Белок с архитектурой 1 | P10447 — тирозинкиназа Src (репрезентативный белок) | |
| Доменная архитектура 2 | BAR + SH3_1 | |
| Белок с архитектурой 2 | P39743 — белок эндоцитоза (репрезентативный белок) |
Карта локального сходства (dotplot) построена с помощью NCBI BLASTp (Align two or more sequences - Dot Plot).
Рисунок 5. Карта локального сходства (dotplot) белков P10447 и P39743. Единственная диагональ соответствует общему SH3-домену.
На карте обнаруживается единственная диагональ, что означает одну область локального сходства между двумя белками. Это и есть общий SH3-домен: именно он гомологичен в обеих последовательностях, тогда как остальные домены — SH2 и тирозинкиназный у P10447, BAR у P39743 — друг другу не гомологичны и на карте не отображаются.
В диагонали наблюдается разрыв — нормальная эволюционная вариация внутри доменного семейства.
Таким образом, несмотря на принципиально разный белковый контекст (сигнальная киназа vs. белок регуляции кривизны мембраны), SH3-домены обоих белков сохраняют гомологию, что подтверждает общее эволюционное происхождение домена вне зависимости от архитектуры содержащего его белка.