Задание 0. Знакомство с OPM
Я зашел на сайт OPM затем во вкладке Types выбрал Transmembrane, а оттуда Beta-barrel transmembrane. Всего структур трансмембранных белков, имеющих бета-лист в трансмембранной части оказалось 459 штук. На сайте интересная классификация по белкам (Proteins) и сборкам (Assemblies), Последние, как я понял, представляют собой полноценные комплексы из различных белковых субъединиц.
Белки в этой базе данных могут быть Monotopic, т.е. монотопными белками, встроенными в мембрану, но не прошивающими её насквозь. Могут быть Peripheral, то есть периферическими белками, находящимися на поверхности мембраны. И делятся на классы в зависимости от того, какую структуру они имеют: только альфа-спирали, только бета-листы, альфа спирали и бета листы перемежаются, альфа спирали и бета листы разделены пространственно
Из интересного для трансмембранных белков имеется класс Bitopic proteins, который включает белки, пересекающие мембрану ровно один раз своей альфа-спиралью.
Также в базе данных выделяют третий тип мембранных белковых молекул: мембранно-активные пептиды. Которые также различаются в зависимости от их строения.
Я решил зайти на страницу с описанием выданной мне структуры белка Connexin-50: 7jjp, он состоит из 12 субъединиц. При описании белка OPM ссылается на базы данных: PDB sum, PDB, MSD, Encompass и MMBD; Также есть ссылка на Uniprot, TCDB, PFAM и InterPro.
Задание 1. Основное задание
Как я уже писал выше, для анализа я выбрал структуру белка Connexin-50 – 7jjp:Русское название: Коннексин-50 или белок щелевых контактов альфа-8
Английское название: Connexin-50 или gap junction alpha-8 protein (GJA8)
Идентификатор PDB: 7jjp
Идентификатор Uniprot: CXA8_SHEEP
Организм: Ovis aries
Локализация: клеточная мембрана
Краткое описание функций: структурный компонент щелевых соединений хрусталика глаза, они соединяют цитоплазму соседний клеток. Данное соединение обеспечивает транспорт веществ до более глубоких слоев хрусталика. Мутации в коннексине-50 приводят к катаракте, так как этот белок крайне важен для поддержания гомеостаза внутри хрусталика.
Координаты трансмембранных участков для каждой субъединицы:
1-ый (21-46), 2-ой (74-91), 3-ий (159-179), 4-ый (207-232)
Для начала я скачал последовательность белка Connexin-50 (GJA8) в FASTA-формате из Uniprot
Затем подал эту последовательность в качестве запроса в DeepTMHMM получил следующие результаты по трансмембранным участкам:
1-ый (22-42), 2-ой (72-92), 3-ий (162-182), 4-ый (211-231)
Файл с результатами в формате .gff3
Предсказанные DeepTMHMM и определенные программой от OPM трансмембранные участки почти полностью совпадают: кол-во трансмембранных участков совпадает точно(все трансмембранные участки нашлись), координаты совпадают почти точно. Отличаются лишь внешние границы: в среднем на 1-2 аминокислоты, максимум на 4 аминокислоты.
OPM - расчитывает трансмембранные участки с учетом эксперимента и 3D структуры, DeepTMHMM - предсказывает по аминокислотной последовательности. Это значит, что DeepTMHMM не располагает точной информации о структуре белка, не может её учесть при определении трансмембранных участков, а потому выявляет немного другие трансмембранные сегменты в белке.
Кроме того, DeepTMHMM не учитывает то, что липидный состав в клетках хрусталика отличается от усредненной клетки, OPM же скорее всего это учитывает, а потому определяет другие границы для трансмембранных участков.
И последнее, коннексин-50 образует 12-мер. И очевидно, что различные мономеры могут взаимодействовать друг с другом, что уменьшает точность определения границ трансмембранных участков DeepTMHMM.