Практикум 7. Трансмембранные белки.

1. База данных OPM.

Для выполенния заданий был выбран белок из базы Orientation of Proteins in the Membrane OPM > Transmembrane > Alpha-helical polytopic > Rhodopsin-like receptors and pumps > Microbial and algal rhodopsins > Archaerhodopsin-1 (1uaz). Этот белок является протонной помпой, активирующейся при воздействии светом. Если открыть его структуру в JMol, видно, как между альфа-спиралей скоординирован ретиналь.

Аналогчно (спускаясь вниз по группам белков) был найден второй белок, он в трансмембранной части содержит бета-слой: Transmembrane > Beta-barrel transmembrane > Mitochondrial and plastid porins > Voltage-dependent anion channel (VDAC) porin > VDAC-2 channel. Это белок с названием VDAC-2 channel и идентификатором 4bum. Он является порой между митохондрией и цитозолем, через которую могут проходить маленькие гидрофильные молекулы.

Таблица 1. Основные характеристики выбранных белков. Комментарии см. ниже.

PDB_ID 1UAZ 4BUM
название Archaerhodopsin-1 VDAC-2 channel
толщина гидрофобной части 31.8 ± 1.3 A 23.4 ± 0.9
трансмембранные вторичные структуры 7 альфа-спиралей 19 элементов вторичной структуры образуют бета-бочонок + одна альфа-спираль внутри (малиновая на рисунке)
координаты трансмембранных участков 1(15-38),2(48-68),3(86-104),4(111-133),5(138-160),6(179-197),7(207-230) 1( 14- 21), 2( 28- 33), 3( 40- 46), 4( 55- 62), 5( 70- 74), 6( 81- 87), 7( 95- 102), 8( 111- 119), 9( 123- 130),10( 137- 145), 11( 149- 156),12( 166- 173),13( 180- 184),14( 191- 197),15( 204- 209),16( 218- 226),17( 243- 249),18( 257- 263), 19( 274- 281)
среднее число остатков в спирали \ тяже 18 6
локализация клеточная мембрана Halobacterium sp. внешняя мембрана митохондрий Danio rerio
изображение белка (p-сторона вверх)

Данные в таблице, говорящие о толщине гидрофобной части, были взяты со страниц этих белков в базе OPM. Кроме того, я открыла pdb-структуры этих белокв в программе JMol и сама измерила толщину трансмембранной части белков, значения получились похожие, но измерения были заметно менее точными: сложно расположить "линейку" строго перпендикулярно поверхности мембраны и результат немного зависит от того, от какого до какого аминокислотных остатков измерять. Однозначно можно утверждать, что толщина гидрофобной части у данного белка с альфа-спиралями почти в полтора раза больше, чем толщина гидрофобной части данного белка с бета-бочонком.

Файл с pdb-структурой лучше скачивать из БД OPM, тогда открывается сразу раскрашенная по вторичной структуре модель, атомами почему-то азота и кислорода показано положение двух мембран. Сторона мембраны, обращенная в цитозоль, обозначена атомами азота (синие), обращенная наружу или в межмембранное пространство, обозначена красными атомами кислорода.

2. Анализ предсказания трансмембранных спиралей.

Программы, предсказывающие трансмембранные спирали ( TMHMM и Phobius ), принимают на вход белковую последовательность, поэтому последовательность белка Archaerhodopsin-1 была скачана из Uniprot в fasta-формате.

Как видно из графической выдачи программ (рисунки 3 и 4), обе программы программы верно предсказали количество и примерные координаты трансмембранных участков: на обоих графиках по оси х указаны координаты (в аминокислотных остатках), по оси у - степень уверенности в том, что этот остаток относится к одной из частей белка (разными цветами показаны уверенности для внутренних участков, внешних участков и трансмембранных участков).

Рис.3. Графическая выдача программы TMHMM. Рис.4. Графическая выдача программы Phobius.

Более подробную информацию можно увидеть в текстовой выдаче. Я свела в одну таблицу результаты работы двух программ (только координаты трансмембранных участков), а в последней колонке указала координаты трансмембранных участков, указанные в OPM. Видно, что, во-первых, результаты предсказаний двумя программами расходятся очень слабо (максимум - на пять остатков, только в одном предсказании), но отличаются от информации, указанной в ОРМ. При этом координаты из OPM стабильно отличаются на 5-7 остатков, поэтому я предполагаю, что такой систематический сдвиг может быть результатом ошибки (разной нумерации аминокислотных остатков, ведь файл с последовательностью взят из другой базы данных). Хотя, возможно, это особенность этих алгоритмов.

	tmhmm	    22    41    phobius     23     41	OPM  15-38
	tmhmm	    54    76    phobius     53     75   OPM  48-68                   
	tmhmm	    91   113    phobius     95    113   OPM  86-104
	tmhmm	   120   139    phobius    120    141   OPM  111-133                       
	tmhmm	   149   168    phobius    147    165   OPM  138-160                   
	tmhmm	   181   203    phobius    186    204   OPM  179-197                                           
	tmhmm	   213   235    phobius    210    236   OPM  207-230 

Я решила проверить предположение про разную нумерацию, предполагая, что нумерация, используящаяся на сайте ОРМ, такая же, как в pdb-файле, представленном на этом сайте, и в JMol посмотрела в этом файле, какими являются первые шесть и последние шесть остатков в цепи, а потом нашла эти участки в fasta-файле, с которым работали программы предсказания. Вот что получилось:

	>sp|P69052|BACR1_HALSS Archaerhodopsin-1 OS=Halobacterium sp. (strain SG1) OX=33006 GN=bop PE=1 SV=1
	MDPIALTAAVGADLLGDGRPETLWLGIGTLLMLIGTFYFIVKGWGVTDKEAREYYSITIL
	VPGIASAAYLSMFFGIGLTEVQVGSEMLDIYYARYADWLFTTPLLLLDLALLAKVDRVSI
	GTLVGVDALMIVTGLVGALSHTPLARYTWWLFSTICMIVVLYFLATSLRAAAKERGPEVA
	STFNTLTALVLVLWTAYPILWIIGTEGAGVVGLGIETLLFMVLDVTAKVGFGFILLRSRA
	ILGDTEAPEPSAGAEASAAD 

Жирыным шрифтом обозначены остатки, которые есть в структуре в pdb-файле, курсивом - те остатки по краям последовательности, которых в структуре из ОРМ нет. И действительно, первых шести остатков в структуре нет, поэтому нумерация должна быть сдвинута в какую-нибудь сторону на 6 позиций. Вот какие расстояния получаются, если везде нумеровать так, как остатки идут в fasta-файле:

	tmhmm	    22    41    phobius     23     41	OPM  21-44
	tmhmm	    54    76    phobius     53     75   OPM  54-74                   
	tmhmm	    91   113    phobius     95    113   OPM  92-110
	tmhmm	   120   139    phobius    120    141   OPM  117-140                       
	tmhmm	   149   168    phobius    147    165   OPM  144-166                   
	tmhmm	   181   203    phobius    186    204   OPM  186-203                                           
	tmhmm	   213   235    phobius    210    236   OPM  213-236 

Видно, что тогда в среднем отличия предсказанной структуры от реальной меньше (хотя у TMHMM всё еще есть отличие в координатах в пять аминокислотных остатков), в среднем около двух остатков для обеих программ.

3. База данных TCDB.

База данных TCDB (Transporter classification DataBase) содержит далеко не все белки даже среди транспортёров, так что поиск по pdb_id и по AC (взятому, опять же, из Uniprot), не дал результатов, хотя вообще по идентификаторам искать можно. Потом я попробовала искать по названию "VDAC-2" и нашла два белка, один человеческий, второй дрожжевой. Видимо, этого белка из Halobacterium в базе нет.

Для белков в этой БД указан код ТС (Transport Classification):

На самом деле, в БД намного больше белков VDAC-2, их можно найти, если искать по полному названию, или названию без дефиса, и т.д. Или же можно посмотреть все белки из данного семейства, их всего 10 штук в этой базе.

Про первый белок (Archaerhodopsin-1) в ОРМ указано, что он относится к семейству 3.E.1 The Ion-translocating Microbial Rhodopsin (MR) Family. Однако, в списке белков этого семейства его нет, есть только Archaerhodopsin-2 и Archaerhodopsin-3, имеющие коды:

Я также воспользовалась blast на сайте ОРМ (со стандартными параметрами); оказалось, что первые две находки и есть эти архейные родопсины 2 и 3. Четвертая находка - первый, но бактериальный родопсин. Все они относятся к семейству 3.Е.1.1.

Вернуться на страницу семестра

Вернуться на главную


© potapenko 2017-2018