Name: Intimin (Интимин)
Type: Transmembrane (Трансмембранный)
Class: Beta-barrel transmembrane (белок с β-листами в трансмембранной части)
Superfamily: Autotransporter (Аутотранспортер)
Family: Autotransporter-3 (Аутотранспортер-3)
Species: Escherichia coli
Localization: Bacterial Gram-negative outer membrane (Наружная мембрана грамотрицательных бактерий)
PDB ID: 4e1s
Uniprot: EAE_ECO57
Description: Необходим для прикрепления и стирания повреждений на клетках культуры ткани.
1( 211-219),
2( 226-234),
3( 242-251),
4( 256-264),
5( 272-279),
6( 287-296),
7( 300-308),
8( 329-336),
9( 347-353),
10( 372-380),
11( 387-392),
12( 401-408)
Из записи PDB была скачена последовательность белка в формате fasta и загружена в DeepTMHMM.
1 (15-19)
2 (21-25)
3 (36-44)
4 (49-56)
5 (65-73)
6 (82-88)
7 (94-100)
8 (123-129)
9 (137-144)
10 (166-172)
11 (178-185)
12 (194-201)
Файл выдачи в формате .gff3 можно скачать по ссылке.
Рис.1. Выдача DeepTMHMM
По горизонтальным осям отложены позиции аминокислот белка. По вертикальным - вероятность существования предсказанного положения аминокислоты в некоторой позиции. Разным цветом обозначают разные положения: красный - в мембране, голубой - вне клетки, зеленый - в периплазме, оранжевый - сигнальная последовательность.
Предсказано 12 трансмембранных бетта-листов, это соответствует экспериментально полученной модели, но границы трансмембранных фрагментов в экспериментальной модели и в предстказанной совершенно не совпадают.
Мне был выдан пермеазный белок GsiC транспортной системы глутатиона
Name: Glutathione transport system permease protein GsiC
Swiss-prot AC: Q57RB0 (GSIC_SALCH)
Organism: Salmonella choleraesuis (strain SC-B67)
Description: Часть транспортерного комплекса ABC GsiABCD, участвующая в импорте глутатиона. Вероятно, ответственен за транслокацию субстрата через мембрану
С помощью DeepTMHMM было найдено 6 трансмембранных альфа спиралей.
Файл выдачи в формате .gff3 можно скачать по ссылке.
Рис.2. Выдача DeepTMHMM
1 (9-27)
2 (99-120)
3 (131-151)
4 (173-189)
5 (231-253)
6 (276-292)
Затем файл c предсказанной AlphaFold трехмерной структуры белка был загружен в PPM со следующими параметрами:
Число мембран: 1
Тип мембраны: Грамм- внутр.
Кривизна: да (пусть будет)
Положение N-конца: внутри (на основе предсказания DeepTMHMM)
1 (5-29)
2 (94-120)
3 (127-155)
4 (170-190)
5 (231-253)
6 (271-295)
Количество находок совпадаетс DeepTMHMM - 6 альфа-спиралей. Трансмембранные участки по результатам двух предсказаний довольно сильно пересекаются, хоть и есть небольшой сдвиг концов на несколько аминокислот. Дело в том, что первая модель предсказывает по аминокислотной последовательности, а вторая - по предсказанной AlphaFold PDB структуре. В Uniprot показывается степень достоверности участков модели (Рисунок 3), и если в середине цепи белка она выше 90 из 100, то на концах, в том числе в участках трансмембранных альфа-спиралей, от 50 до 70 или ниже 50. Неточное педсказание структуры может оказывать влияние на точность предсказания.
Рис.3. Предскаанная структура белка Alphaphold (можно заметить, что большая часть структуры имеет высокий уровень предсказания "very-high", окрашена синим)