На главную страницу четвёртого семестра

Предсказание топологии мембранного белка ADT_DROME

0. Построение выравнивания исследуемого белка с заданным прототипом

Нам было дано два белка: ADT_DROME (исследуемый) и ADT1_BOVIN (белок-прототип). Для построения выравнивания последовательностей этих белков было сделано следующее.
Сначала c помощью программы entret пакета EMBOSS были получены файлы с записями SwissProt:
entret sw:Q26365 -auto
entret sw:P02722 -auto
Затем из этих файлов были получены полные последовательности (с помощью программы seqret):
seqret sw:Q26365 -sask
seqret sw:P02722 -sask
Выравнивание было построено с помощью программы needle. Вес выравнивания получился равным 1268.0, а идентичность — 79.3%.
Далее, чтобы импортировать выравнивание в GeneDoc, использовалась программа ClustalX. В ней были выровнены искомые последовательности, а затем выравнивание (аналогичное полученному с помощью needle) было импортировано в GeneDoc.
Его можно увидеть здесь (в формате htm).

1. Предсказание топологии почти вручную

Чтобы построить профиль гидрофобности для изучаемого белка (ADT_DROME), была использована программа pepwindow пакета EMBOSS с двумя параметрами: graph — указывающий тип выходных данных (в нашем случае это data ) и length — размер скользящего окна (брался равным 19 а.о.).
По полученным данным с помощью Excel строился профиль гидрофобности. На основе этого графика описывалась топология изучаемого белка.
График, таблицу с топологией и протокол работы можно увидеть в этом файле. Там же описано, какие изменения были сделаны в файле GeneDoc.

2. Предсказание топологии с помощью наиболее популярной программы

"Наиболее популярная программа" — это TMHMM. С её помощью можно предсказать топологию белка (трансмембранные сегменты, внешние и внутренние петли). Что и было сделано.
Файл с предсказанием и с описанием полученного графика представлен здесь. К файлу marking.msf была добавлена ещё последовательность под названием TMHMM, где указаны результаты предсказания. Разметка объяснена в протоколе.

3. Выделение трансмембранных сегментов в 3D-структуре прототипа

В базе данных OPM (Orientations of Proteins in Membranes database) с помощью идентификатора PDB (1okc) был найден белок-прототип (ADT1_BOVIN) с описанными границами трансмембранных сегментов, которые были указаны в файле с топологией.
Внутренние и внешние петли были определены по PDB-файлу, который можно получить в результате поиска белка.

В результатах поиска указано, что искомый прототип — это субъединица А белка. С помощью программы RasMol на картинке были оставлены только изображение этой субъединицы и мембранные поверхности. Красным отмечена наружная поверхность внутренней мембраны митохондрии (белок митохондриальный), и эта поверхность "смотрит" в межмембранное пространство. Синим же показана внутренняя поверхность мембраны, "смотрящая" в матрикс.
Участки 1-10 и 293-297 (начальный и конечный) обозначены на картинке зелёным цветом. Как видно, они находятся с наружной стороны мембраны и, следовательно, являются внешними петлями. Другие внешние петли обозначены оранжевым, а внутренние — жёлтым.
Трансмембранные сегменты раскрашены чёрным цветом.
После определения внешних и внутренних петель в файл GeneDoc была занесена последовательность с названием OPM и с соответствующей разметкой.

4. Сравнение предсказанных топологий с описанием трансмембранных сегментов в 3D-структуре прототипа

По данным таблицы "Топология белка ADT_DROME" была составлена следующая таблица.

  По профилю гидрофобности TMHMM
Всего предсказано (N) 57 69
Из них      
  А. По данным ОРМ находятся внутри мембраны 51 65
  В. Из них - "торчащие" из мембраны остатки на концах спиралей 6 4
  С. Вообще не имеют никакого отношения к трансмембранным спиралям 0 0
D. Число непредсказанных остатков, которые по данным ОРМ находятся в мембране. 94 80
Точность предсказания, A/N 0,895 0,942
Сверхпредсказание, C/N 0 0
Недопредсказание, D/(L-N), где L-длина последовательности 0,392 0,351

Как видно из таблицы, точность предсказаний высока — как по профилю гидрофобности, так и по TMHMM (в последнем случае вообще получился великолепный, по моему мнению, результат — примерно 95%!).

Необходимо пояснить, что значит термин "торчащие" остатки. Это предсказанные вручную либо с помощью TMHMM остатки, которые OPM не выдал как трансмембранные, но которые составляют один сегмент с предсказанными в пункте А остатками.

Нет остатков, которые по данным OPM не имеют отношения к трансмембранным спиралям. Это потому, что каждый предсказанный вручную или с помощью TMHMM сегмент был получен и с помощью OPM (в других границах, но сходство в выравнивании большое). Подтвердить это может само выравнивание.

Очень большим получилось недопредсказание. Это связано с тем, что OPM выдал шесть трансмембранных сегментов, а предсказалось в обоих случаях только три. Впрочем, результат по профилю гидрофобности достаточно субъективен (из-за того, что было рассмотрено только три пика). Так что большой процент недопредсказания в первом случае вполне объясним. А в случае с TMHMM... Может быть, программа просто не "учла", что остатки в начале и в конце последовательности могут быть трансмембранными.


© Кривошей Александр, 2006