Записи в базе данных OPM (Orientations of Proteins in Membranes) описывают биологические единицы (biological units). Они классифицируются по структуре их основных мембранных или ассоциированных с мембраной доменов. Эта классификация основана на данных из баз SCOP (судя по всему, сейчас недоступной) и TCDB (в этой БД белки также классифицированы на множество семейств по структуре и функциям). Вданной классификации выделены 4 уровня:
1.Тип: трансмембранные, монотопические (заякориваются на одной стороне мембраны) или периферийные (ассоциируются с мембраной обратимо) и мембрано-активные пептиды (встраиваются в мембрану, нарушая её целостность);
2.Класс: α-спиральные, β-листовые, α+β, α/β или нерегулярные белки (т.е. по вторичной структуре);
3.Суперсемейство: эволюционно связанные белки с выравниваемыми 3D-структурами;
4.Семейство: белки, для которых обнаружена гомология последовательностей.
Таким образом, в описаниях белка в этой БД кроме ссылок на TCDB есть ссылки на InterPro, Pfam, PDB и UniProt (ведь эти БД предоставляют информацию, используемую для классификации).
С помощью поиска по уровням классификации был найден белок, содержащий β-листы в трансмембранном домене. Это трансмембранный битопический β-барель из семейства рецепторов внешней мембраны суперсемейства лиганд-зависимых белковых каналов - бактериальный Zn-транспортер ZnuD.
Для анализа был выбран пентамерный лиганд-зависимый ионный канал ELIC (мутантный вариант P254G) (Pentameric ligand-gated ion channel ELIC mutant P254G) (PDB 5HEO, UniProt E0SJQ4_DICD3). Это трансмембранный белок, расположенный на внутренней мембране Dickeya dadantii. Это катион-селективный канал с высокой проводимостью, активирующийся первичными аминами, такими как цистамин, пропиламин, ГАМК. Предположительно, эти каналы вовлечены в формирование ответа клетки на изменение pH среды.
Биологическая единица данного белка состоит из 5 идентичных субъединиц. По данным OPM координаты трансмембранных участков практически идентичны для каждой из них:
1(202-224), 2(230-251*), 3(261-282), 4(299-315)
*Для 3, 4, и 5 субъединиц это 252 позиция
Таким образом, по данным OPM в структуре каждой из 5 субъединиц белка имеется 4 трансмембранных сегмента. Все они представлены α-спиралями.
Последовательность белка, взятая из PDB, была проанализирована с помощью сервиса DeepTMHMM (см. рис. 1). Следующие участки были предсказаны как трансмембранные:
1(203-223), 2(232-252), 3(260-282), 4(296-317)
Таким образом, оба сервиса предсказывают одни и те же α-спирали как трансмембранные, отличаются лишь границы перехода трансмембранных участков во внешние или внутренние (максимум - на 3 аминокислотных остатка). Это может быть связано с тем, что:
1. DeepTMHMM не учитывает, что это белок внутренней мембраны бактерий, и что его внешняя часть на самом деле находится в периплазме;
2. Программа, использованная для получения результата, представленного в OPM, может использовать другой подход для решения данной задачи и, таким образом, выдавать несколько отличающийся результат;
3. Белок не сидит в мембране как намертво приваренный, в любом случае имеет место некоторая его подвижность. Это и могло стать причиной различия в результатах.