Для работы в рамках данного практикума был выбран белок Phenol degradation pathway involved protein. Ниже приведены его характеристики на основе данных из OPM:
Здесь приведена функция данного белка: Protein involved in meta-pathway of phenol degradation-like protein
С помощью программы DeepTMHMM были предсказаны трансмембранные участки у этого белка (на вход программе подавалась последовательность белка в fasta-формате из соответствующей записи в Uniprot). Ниже приведено изображение выдачи программы (с текстовой выдачей можно ознакомиться здесь):
Ниже представлена таблица со сравнением выдачи трансмембранных участков с сайта OPM и программой DeepTMHMM:
Number | OPM | DeepTMHMM |
---|---|---|
1 | 16-24 | 37-47 |
2 | 47-54 | 63-74 |
3 | 64-73 | 84-96 |
4 | 90-100 | 106-120 |
5 | 109-118 | 130-143 |
6 | 136-146 | 151-165 |
7 | 154-162 | 173-184 |
8 | 182-191 | 199-211 |
9 | 198-204 | 216-228 |
10 | 225-232 | 241-252 |
11 | 240-245 | 259-270 |
12 | 258-266 | 275-286 |
Из результатов в таблице видно, что в обоих случаях трансмембранных участков 12 штук, однако, кажется, что результаты предсказаний не совпадают. Стоит отметить, что первые 20 аминокислот - сигнальный участок, также можно заметить, что если прибавить 20 остатков к границам участков OPM, то перекрытия будут гораздо лучше. Поэтому было решено вырезать первые 20 АК из последовательности fasta, и снова запустить DeepTMHMM. Ниже представлено новое сравнение с изображением DeepTMHMM (и ссылка на файл):
Number | OPM | DeepTMHMM |
---|---|---|
1 | 16-24 | 17-27 |
2 | 47-54 | 43-54 |
3 | 64-73 | 64-76 |
4 | 90-100 | 86-100 |
5 | 109-118 | 110-123 |
6 | 136-146 | 131-145 |
7 | 154-162 | 153-164 |
8 | 182-191 | 179-191 |
9 | 198-204 | 196-208 |
10 | 225-232 | 221-232 |
11 | 240-245 | 239-250 |
12 | 258-266 | 255-266 |
Теперь результаты предсказаний совпадают хорошо, 12 участков и все перекрываются, границы выходят в среднем на 5 аминокислот. Однако все равно программа DeepTMHMM делает странности: первые 10 аминокислот она определяет как сигнальную последовательность, что написано в текстовой выдаче, хотя истинная сигнальная последовательность была удалена).
Для выполнения данного задания мне был выдан белок Fluoride ion transporter CrcB, structure 2 (он же Белок CrcB — транспортер фторид-ионов (структурный вариант 2)). Ниже приведены его характеристики на основе данных из OPM:
Ниже приведены функции данного белка:
С помощью программы DeepTMHMM были предсказаны трансмембранные участки у этого белка (на вход программе подавалась последовательность белка в fasta-формате из соответствующей записи в Uniprot). Ниже приведено изображение выдачи программы (с текстовой выдачей можно ознакомиться здесь):
Ниже представлена таблица со сравнением выдачи трансмембранных участков с сайта OPM и программой DeepTMHMM:
Number | OPM | DeepTMHMM |
---|---|---|
1 | 6-29 | 9-28 |
2 | 37-57 | 37-57 |
3 | 66-79 и 83-93 | 69-86 |
4 | 98-126 | 99-123 |
Примечение: в OPM 3 трансмембранный участок разбит на 3A и 3B, потому что они работают как единый функциональный домен, но с внутренней структурной границей.
При сравнении результатов можно сделать вывод, что предсказания очень удачно совпадают, отличие границ незначительно. Плюс замечательно, что DeepTMHMM не предсказал сигнальный участок, как это было в прошлом задании.