Практикум 11. Pfam: домен Ras
1. Выбор семейства доменов
Выбран домен PF00071 (Ras) из базы Pfam 38.1. Критерии: #seed = 60 (>20), число структур ~2 000 (>3).
2. Описание семейства
Таблица 11-1. Общие сведения о домене Ras
| AC pfam | PF00071 |
|---|---|
| ID pfam | Ras |
| #SEED | 60 |
| #All | 315 000 |
| #SW | 999 |
| #architectures | 3 487 |
| #3D | ~2 000 |
| #eukaryota | ~300 000 |
| #archaea | ~100 |
| #bacteria | ~15 000 |
Функция и структура
Домен Ras — GTP-связывающий домен, работающий как молекулярный переключатель. Белки семейства участвуют в передаче сигналов, регулирующих клеточный рост, дифференцировку и апоптоз. Домен имеет укладку: шеститяжевый β-лист, окружённый пятью α-спиралями. Семейство включает подсемейства: Ras, Rab, Rac, Ral, Ran, Rap, Ypt1 и другие.
Таксономическая распространённость
Домен встречается преимущественно у эукариот (~95% белков). У бактерий (~5%) представлен в основном у патогенов. У архей практически отсутствует. Огромное число доменных архитектур (3 487) говорит о комбинаторном разнообразии.
3. Анализ выравнивания Seed
Проект Jalview: PF00071_Ras.jvp
Таблица 11-2. Характеристики выравнивания
| Характеристика | Значение |
|---|---|
| Число последовательностей в seed | 60 |
| Число колонок в выравнивании | 229 |
| МДБ-all (все последовательности, без гэпов) | 60–106 (все 60 последовательностей) |
| 100% консервативные колонки в МДБ-all | 69:D, 70:T, 71:A, 72:G, 74:E; 73:Q (59/60) |
| МДБ-notAll (не все последовательности) | 1–6 |
| Последовательности МДБ-notAll (без гэпов) | RAB3_DROME, RASC_DICDI, RHOA_CANLF, RAB5A_CANLF, RAB17_MOUSE (5 из 60) |
| Недостоверный участок | 191–197 (у всех гэпы) |
Комментарии к выравниванию
- МДБ-all (60–106): охватывает G-домен Ras — наиболее консервативную часть. Все 60 последовательностей выровнены без гэпов.
- МДБ-notAll (1–6): N-концевое расширение, присутствующее у 5 последовательностей (RAB3_DROME, RASC_DICDI, RHOA_CANLF, RAB5A_CANLF, RAB17_MOUSE). При сортировке по блоку и раскраске по Clustal с порогом 75% идентичности эти последовательности группируются, показывая эволюционно консервативный сигнал у данного подмножества. У остальных 55 последовательностей на этом участке гэпы.
- Недостоверный участок (191–197): область, где у всех последовательностей гэпы — выравнивание не имеет биологического смысла.
4. Карта локального сходства (dotplot)
Для построения dotplot выбраны два белка с разной доменной архитектурой:
| Белок | UniProt AC | Архитектура |
|---|---|---|
| RASH_HUMAN | P01111 | PF00071 (только Ras) |
| Q12829 | Q12829 | PF00071 - PF07525 (Ras + SOCS_box) |
На карте видна чёткая диагональная линия в области Ras-домена (остатки 1–170 P01111 и 290–460 Q12829), что подтверждает высокое сходство и гомологию этих участков. Остальные области (SOCS-box у Q12829 и С-конец P01111) не показывают значимого сходства, что соответствует разной доменной архитектуре. Это демонстрирует, что локальное сходство ограничено общим доменом, а остальные части белков эволюционно разошлись.