В OPM система классификации иерархическая:
База OPM ссылается на: PDB, UniProt, TCDB, Pfam, PubMed
При знакомстве с интерфейсом OPM я рассмотрела β-листовой трансмембранный белок, код PDB -- 6EUS.
На странице этого белка в UniProt описания функции нет, но согласно данным в литературе белок является тримерным порином внешней мембраны. Он служит каналом для транспорта дикарбоновых кислот, влияет на проницаемость внешней мембраны бактерии A. baumannii.
Для основного задания я взяла белок 7m95. Это внутриклеточный сигма-рецептор 2 (Sigma intracellular receptor 2) из Bos taurus. Он находится в мембранах ЭПР, лизосом и плазматической мембране и контролирует захват холестерина из крови и его вынос из лизосом. Также он контролирует аутофагию и способствует расщеплению неправильных или лишних белков-предшественников на поверхности ЭПР, стабилизирует рецепторы на поверхности клетки и может изменять активность некоторых белков цитохрома Р450.
Идентификатор PDB: 7M95
Идентификатор UniProt: SGMR2_BOVIN
Координаты трансмембранных участков белка, приведенные в OPM:
1( 9- 35), 2( 64- 89), 3( 96- 119), 4( 141- 163) (цепи A, B)
Для последовательности белка из UniProt было запущено DeepTMHMM (рис. 4)
Предсказанные программой координаты: 1(10- 30), 2(68- 88), 3(98- 119), 4(141- 162).
Ссылка на файл в формате gff3
Предсказание получилось довольно точным, максимальная разница в 5 нуклеотидов есть в первом участке, во втором четыре, а в двух последних она всего 1-2 или вообще границы совпали.
Различия обусловлены тем, что алгоритм DeepTMHMM учитывает только последовательность, а алгоритм работы OPM всё-таки учитывает и пространственную структуру (угол наклона и возможное притягивание заряженных участков аминокислот к полярным головкам липидов). Альфа-спирали в моём белке немножко изогнуты, из-за чего и происходят несущественное расхождение в результатах.