Семейство доменов я выбриал случайно: перешел во вкладку с буквой H и выбрал семейство с подходящими под ограничения параметрами - HK_sensor (правда последовательностей в seed 19, но я подумал, что это несущественное нарушение ограничений).
а) Я выбрал семейство Сенсорных доменов двухкомпонентных гистидинкиназ (Sensor domain of 2-component histidine kinase). Его ID - PF16750. Эти домены расположены на N-конце гистидинкиназ - интегральных мембранных белков бактерий. Функция этих белков - ответ на изменения окружающей среды, а сенсорного домена в них - непосредственное связывание лиганда [1].
b) Общее число последовательностей и число последовательностей в выравнивании seed для этого семейства доменов 123 и 19 соответственно.
c) Доменных архитектур с этим доменом 6.
d) Первая по количеству последовательностей доменная архитектура содержит 89 последовательностей и имеет структуру HK_sensor, HAMP, HisKA, HATPase_c.
Вторая по количеству последовательностей доменная архитектруа содержит 22 последовательности и имеет структуру HK_sensor, HisKA, HATPase_c.
e) Всего для 1 белка с этим доменом известна структура.
f) Этот домен встречается только в белках Протеобактерий. У Гаммапротеобактерий 73 белка с HK_sensor, а у Бетапротеобактерий 2 белка с этим доменом. В остальных группах Протеобактерий этот домен не встречается.
g) HMM профиль выравнивания был создан в феврале 2015 года. Всего в нем 110 позиций.
Карта локального сходства двух белков с разной доменной архитектурой представлена ниже:
Видимо, произошла делеция или вставка длиной 10 аминокислот.
Для первой по величине группы (бежевый цвет) можно выделить несколько специфичных только для нее особенностей последоватльности:
Для второй по величине группы (бирюзовый цвет) можно выделить слудующие специфичные только для нее особенности:
Ссылка на проект Jalview ниже:
Проект JalviewТаблица с необходимыми колонками в формате Excel доступна для скачивания ниже:
Таблица с белками из UniProt1 - West AH, Stock AM. Histidine kinases and response regulator proteins in two-component signaling systems. Trends Biochem Sci. 2001 Jun;26(6):369-76. doi: 10.1016/s0968-0004(01)01852-7. PMID: 11406410.