Координаты трансмембранных участков:
1(2-13),2(39-48),3(58-68),4(75-88),5(98-103),6(125-132),7(138-146),8(170-179),9(185-194),10(213-221),11(227-235),12(269-278),13(284-293),14(305-314),15(320-329),16(343-352),17(361-370),18(411-420)
Последовательность для анализа с помощью DeepTMHMM была взята из UniProt(P02943).
Ссылка на выдачу предсказанных программой координат трансмембранных участков.
Совпадение низкое - в 20.8%.
Из результатов сравнения можно сделать вывод, что основной причиной расхождения в нумерации аминокислотных остатков между данными OPM и предсказаниями DeepTMHMM является наличие в исходной последовательности UniProt сигнального пептида длиной 25 аминокислот.
OPM использует аннотации для зрелой формы белка, где этого пептида уже нет, в то время как DeepTMHMM работает с полной последовательностью, включая этот участок. Если учесть сдвиг на 25 остатков совпадение позиций сегментов значительно улучшается, что подтверждает данную причину как ключевую.
Координаты трансмембранных участков:
1( 52- 78), 2( 85- 109), 3( 122- 148), 4( 167- 189), 5( 214- 239), 6( 259- 282), 7( 304- 327)
Последовательность для анализа с помощью DeepTMHMM была взята из UniProt(P47900).
Ссылка на выдачу предсказанных программой координат трансмембранных участков.
Результаты совпадают превосходно. Общее перекрытие между эталонными данными из OPM и предсказанием DeepTMHMM составляет 85.8%, что является очень высоким показателем. Алгоритм абсолютно корректно определил количество трансмембранных спиралей — все семь сегментов были найдены. Незначительные расхождения в несколько аминокислот на границах спиралей (например, предсказание начинается или заканчивается на 1-3 остатка раньше или позже) являются совершенно нормальными и ожидаемыми для методов предсказания.
Такой результат однозначно свидетельствует, что мы имеем дело с классическим α-спиральным мембранным белком, а алгоритм DeepTMHMM блестяще справился со своей задачей, точно определив локализацию всех трансмембранных доменов.