Для выполнения заданий был получен белок UPF0182 protein CE0802 из бактерии Corynebacterium efficiens (strain DSM 44549 / YS-314 / AJ 12310 / JCM 11189 / NBRC 100395). На uniprot об этом белке особо ничего не написано, что грустно :(. Но доступны последовательность и предсказание структуры. Сама же бактерия принадлежит роду Corynebacterium. Этот род содержит грам-положительные и, в основном, аэробные бактерии.
Для работы был выбран задезайненный трансмембранный β-бачонок TMB2.3. На uniprot ссылка отсутсвует. Индефикатор pdb 6x1k
Толщина гидрофобной части была измерена в программе PyMol и составила 24.2 Å. В среднем, один β-тяж состоит из 8 аминокислотных остатков. Координаты трасмембранных участков вторичных структур представлены ниже:
1( 9- 15), 2( 23- 31), 3( 38- 43), 4( 50- 60), 5( 66- 75), 6( 82- 93), 7( 100- 106), 8( 114- 122)
Толщина гидрофобной части 24.2 Å
Угол изгиба 14°
ΔG -28.5 ккал/моль
Топология субъединица А (внеклеточный N-конец)
Качество ЯМР
PDB Индефикатор 6x1k
Количство вторичных ТМ структур 8
Uniprot :(
На картинке представлены измерения трансмембранного участка. p-сторона направлена вниз.
Последовательность.
Топология может быть скачана в форматах .gff3 и .3line
По оси x отложены номера остатков, а по y разные вещи, в зависимости от верхнего или нижнего рисунков. На верхнем рисунке представлена пренадлежность остатка к той или иной топологии, а на нижнем - вероятность принадлежности к этой топологии.
>6X1K_1|Chain | BETA
MQDGPGTLDVFVAAGWNTDNTIEITGGATYQLSPYIMVKAGYGWNNSSLNRFEFGGGLQYKVTPDLEPYAWAGATYNTDNTLVPAAGAGFRYKVSPEVKLVVEYGWNNSSLQFLQAGLSYRIQP
SSSSSSSSSSPBBBBBOOOOOBBBBBBBBBPPPPPBBBBBBBBBBOOOOOOBBBBBBBBBPPPPPPPBBBBBBBBOOOOOOOOBBBBBBBBBPPPPPBBBBBBBBOOOOOOBBBBBBBBBPPPP
##gff-version 3
# 6X1K_1|Chain Length: 124
# 6X1K_1|Chain Number of predicted TMRs: 8
6X1K_1|Chain signal 1 10
6X1K_1|Chain periplasm 11 11
6X1K_1|Chain Beta sheet 12 16
6X1K_1|Chain outside 17 21
6X1K_1|Chain Beta sheet 22 30
6X1K_1|Chain periplasm 31 35
6X1K_1|Chain Beta sheet 36 45
6X1K_1|Chain outside 46 51
6X1K_1|Chain Beta sheet 52 60
6X1K_1|Chain periplasm 61 67
6X1K_1|Chain Beta sheet 68 75
6X1K_1|Chain outside 76 83
6X1K_1|Chain Beta sheet 84 92
6X1K_1|Chain periplasm 93 97
6X1K_1|Chain Beta sheet 98 105
6X1K_1|Chain outside 106 111
6X1K_1|Chain Beta sheet 112 120
6X1K_1|Chain periplasm 121 124
Последовательность.
Топология может быть скачана в форматах .gff3 and .3line
>sp|Q8FRF9|Y802_COREF | TM
MATGLTPPPQPIKRPPKAVTWIIGIIALLVLVTPLTVGFYTDWLWFGEVDYRGVFSTVIVTRIILFIVFALLAGFVTWLAGYFTIRLRPDDLTAFDAESPVFQYRQMIENSLRRILIIVPIFVGLLGGLVGQRSWQTVQLFLNREPFGVEDQQFGMDYGFYAFTLPMLRLITSSLSTLLVVAFIIALVGHYLLGGIRPGNQMTGQKAFISRGARAQLAVTAGLWMLVRVATYWLERYDLLTRENATFTGAGYTDINAHLPAKIILMVISIIVAVAFFSAIFLRDLRIPGLAVVLLVLSSVVVGAVWPLMLERFSVQPNRAEKESEYISRNIESTRFAYGITDDEVTYIENWGAGGATNAEVAADEATISNIRLLDPQILSPTFTQQQQLRNFYGFPEQLAMDRYEVDGELRDFVVAARELDPNSLQQNQQDWINRHTVYTHGNGFIAAQANQVDEVARDVGSTRGGYPVYTVSDLQTNARAAESEDAEELGIMVEQPRIYYGPLIASAADGKDYAIVGDTGDGPVEYDTDSTSYTYDGEGGVGIGNLFNRAAFALRYQEMNMILSDRVGSESKILFERDPRTRVEKVAPWLTTDSKSYPAVIDGSIKWIVDGYTTLSSLPYATRTSLTEATLDSVVVDNFQQPLLTEEVGYIRNSVKAVVDAYDGTVELYEFDSEDPVLKAWRGVFPDVVQPESEISNELRDHLRYPEDMFKVQREMLSRYHVEDAGTFFTNDAFWSVPNDPTAPEGRQEMKQPPYYVVAADPDTGESSFQLITPFRGLQREFLSAHMTASSDPDNFGKITVRVLPTGAVTQGPKQAQDAMMSSDQVAQDQTLWRGSNDLFNGNLLTLPVGGGEILYVEPIYSQRRDQESAFPKLLRMLVFYKGQVGYAPTIAEALSQVGIDPAAAQDIEVVEEDGTVTVPDVNATEDADATTDGEDETPAAPAAPAGSEAEGIEAINEALRNLEAARDGSFEEYGRALDALDRAVESYQGAGTAE
IIIIIIIIIIIIIIIIIIMMMMMMMMMMMMMMMMMMMMMOOOOOOOOOOOOOOOOOOOMMMMMMMMMMMMMMMMMMMMMMIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIIMMMMMMMMMMMMMMMMMMMMMOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOMMMMMMMMMMMMMMMMMMMMMMMIIIIIIIIIIIIIIIIIIIIIIIIIIIMMMMMMMMMMMMMMMMMOOOOOOOOOOOOOOOOOOOOOOOOOOOOOMMMMMMMMMMMMMMMMMMMMIIIIIIMMMMMMMMMMMMMMMMMMOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOOO
##gff-version 3
# sp|Q8FRF9|Y802_COREF Length: 996
# sp|Q8FRF9|Y802_COREF Number of predicted TMRs: 7
sp|Q8FRF9|Y802_COREF inside 1 18
sp|Q8FRF9|Y802_COREF TMhelix 19 39
sp|Q8FRF9|Y802_COREF outside 40 58
sp|Q8FRF9|Y802_COREF TMhelix 59 80
sp|Q8FRF9|Y802_COREF inside 81 114
sp|Q8FRF9|Y802_COREF TMhelix 115 135
sp|Q8FRF9|Y802_COREF outside 136 166
sp|Q8FRF9|Y802_COREF TMhelix 167 189
sp|Q8FRF9|Y802_COREF inside 190 216
sp|Q8FRF9|Y802_COREF TMhelix 217 233
sp|Q8FRF9|Y802_COREF outside 234 262
sp|Q8FRF9|Y802_COREF TMhelix 263 282
sp|Q8FRF9|Y802_COREF inside 283 288
sp|Q8FRF9|Y802_COREF TMhelix 289 306
sp|Q8FRF9|Y802_COREF outside 307 996
Предсказание с помощью PPM было проделано на Y802_COREF, pdb. Были заданы следующие параметры запуска:
Number of membranes: 1
Type of membrame: GP inner membrane (т.к. _сorynebacterium_ грам положительны)
Allow curvature: No
Topology (N-ter): Inside (по предсказанию DeepTMHMM)
Heteroatoms: No
Были получены модель и результаты:
Толщина гидрофобной части 30.9 ± 0.9 Å
Угол изгиба 9 ± 0°
ΔG -119.4 ккал/моль
Количство вторичных ТМ структур 7
Координаты трасмембранных участков вторичной структуры представлены ниже:
1( 17- 40), 2( 59- 84), 3( 115- 135), 4( 167- 192), 5( 213- 235), 6( 261- 282), 7( 285- 305)
На картинке представлены измерения трансмембранного участка. p-сторона направлена вниз.
DeepTMHMM | PPM | |
---|---|---|
1 | 19-39 | 17-40 |
2 | 59-80 | 59-84 |
3 | 115-135 | 115-135 |
4 | 167-189 | 167-192 |
5 | 217-233 | 213-235 |
6 | 263-282 | 261-282 |
7 | 289-306 | 285-305 |
Можно сказать, что результаты алгоритмов очень похожи. Однако, DeepTMHMM старается сужать трансмембранные участки. То есть α-спирали предсказанные PPM на пару-тройку а.о. длиннее. В принципе, можно порадоваться. Два алгоритма дали практически одинаковый результат, а AplhaFold хорошо себя проявил на трансмембранных участках (всё синенькое). Интересующие нас, трансмембранные, участки были хорошо предсказаны AlphaFold'ом, поэтому можно сказать, что на результат работы PPM предсказание структуры повлиять не должно было. Хотя кто его знает... :)
6x1k: 1.B.6
Так как данная структура была задезайнена, полный код получить не удалось.
Y802_COREF: не нашлось :( Искал по ID Q8FRF9