Цель задания: сравнить результаты предсказаний трансмембранных участков по последовательности (с помощью DeepTMHMM) и по трехмерной структуре (база данных OPM) в β-листовом белке.
В базе данных OPM был выбран белок из типа Transmembrane, класса Beta-barrel transmembrane, суперсемейства Sugar porins (n=18,S=22), семейства Malptoporin-like proteins. Название белка - Sucrose-specific porin (сахарозо-специфичный белок), он находится во внешней мембране Грам-отрицательной бактерии Salmonella enterica. Идентификаторы в PDB и UniProt - 1a0s и SCRY_SALTM соответственно. Примечательно, что в PDB название бактерии отображается как Salmonella enterica subsp. enterica serovar Typhimurium, а в Uniprot - Salmonella typhimurium. Судя по описанию в Uniprot, это белок-порин, ответственный за поглощение клеткой сахарозы.
Координаты трансмембранных учатков приведены в OPM для 3 субъединиц белка - P, Q и R:
P - Tilt: 1 - TM segments: 1(75-86),2(116-124),3(136-145),4(162-167),5(181-186),6(208-213),7(223-230),8(244-253),9(256-263),10(287-296),11(306-314),12(336-344),13(351-360),14(374-383),15(389-398),16(417-426),17(438-447),18(473-482)
Q - Tilt: 2 - TM segments: 1(75-86),2(116-124),3(136-145),4(158-167),5(182-186),6(208-213),7(223-230),8(243-253),9(256-263),10(287-296),11(306-314),12(336-344),13(351-360),14(374-383),15(389-398),16(417-426),17(438-447),18(473-482)
R - Tilt: 1 - TM segments: 1(75-86),2(116-124),3(136-145),4(162-167),5(181-186),6(208-213),7(223-230),8(244-253),9(256-263),10(287-296),11(306-314),12(336-345),13(351-360),14(374-383),15(389-398),16(417-426),17(438-447),18(473-482)
Из UniProt была скачана последовательность белка в формате fasta. Для этой последовательности была запущена программа DeepTMHMM, в результате которой было получено представленное ниже графическое изображение.
Из данного изображения видно, что наш белок имеет пронизывающие мембрану участки (показаны красными линиями) и небольшую локализованную в мембране сигнальную часть (показана желтым). Также у белка есть участки, локализованные в периплазме (показаны зеленым) и снаружи клетки (показаны синим). Файл с результатами предсказаний DeepTMHMM доступен по ссылке. Как трансмембранные бета-листы были предсказаны участки с координатами 99-107, 139-145, 160-172, 139-145, 160-172, 178-187, 203-210, 226-234, 246-252, 267-273, 279-285, 310-316, 330-336, 359-365, 375-382, 397-403, 413-420, 440-447, 462-468, 495-503. Т.е. всего предсказан 21 трансмембранный участок.
Сравнивая результаты OPM и DeepTMHMM, можно отметить различие в числе найденных участков (18 против 21) и в их координатах. Любопытно, что несмотря на то, что DeepTMHMM нашел большее количество таких участков, некоторые участки, найденные OPM, эта программа не нашла - например, участки 75-86 и 473-482
Цель задания: сравнить результаты предсказаний трансмембранных участков по последовательности (с помощью DeepTMHMM) и по трехмерной структуре (база данных OPM) в α-спиральном белке
В качестве структуры, содержащей трансмембранный α-спиральный белок, мне была выдана структура 6c3i. Это переносчик двухвалентных металлов MntH (Divalent metal cation transporter MntH) бактерии Deinococcus radiodurans. Идентификаторы в PDB и UniProt - ... и ... соответственно. Согласно данным из Uniprot, этот белок осуществляет H+ -стимулируемое поглощение ионов двухвалентных металлов. Поскольку в белке две цепи (А и В), мною была выбрана цепь А (примечательно, что при запросе по названию белка в OPM в разделе Subunits выдается информация только о цепи А).
OPM определяет локализацию этого белка как находящийся во внутренней мембране Грам-отрицательной бактерии. В OPM приведены следующие координаты трансмембранных участков выбранной цепи: 1( 47- 67), 2( 73- 92), 3( 114- 145), 4( 151- 166), 5( 175- 196), 6( 217- 237), 7( 262- 282), 8( 313- 336), 9( 349- 366),10( 370- 394),11( 410- 431)
Запуск DeepTMHMM для последовательности цепи А показал графический результат, представленный ниже:
Из данного изображения видно, что наш белок имеет пронизывающие мембрану участки (показаны красными линиями), участки, обращенные наружу (синие) и внутрь клетки (розовые). Файл с результатами предсказаний доступен по ссылке, трансмембранные альфа-спиральные участки указаны в выдаче как TMhelix. Координаты этих участков: 46-55, 74-89, 121-141, 151-167, 177-195, 218-234, 264-281, 314-332, 354-366, 375-390, 413-425.
И OPM, и DeepTMHMM нашли 11 трансмембранных участков. В координатах этих участков сильных отличий не обнаруживается, максимум на 7-8 аминокислот.