На страницу четвёртого семестра

Предсказание топологии мембранного белка —
— ADP/ATP-антипортера свиньи

Упражнение № 1

С помощью программы pepwindow были получены два столбца координат для построения профиля гидрофобности. В первом, по которому программа проводит сортировку, указаны середины отрезков длины 19 (это число есть выбранный параметр -length программы pepwindow), а во втором — поставленные им в соответствие величины показателя гидрофобности. График был построен в EXCEL (результаты можно посмотреть здесь).

На графике были выбраны 5 пиков. Значений показателя гидрофобности большего, чем 1,8 нет ни на одном участке белка. Проверка границ соответствующих пикам участков осуществлялась следующим образом:

Расположение найденных участков в последовательности белка и предполагаемое положение внутренних петель можно посмотреть здесь. Красным выделены гидрофильные остатки, а зелёным - гидрофобные (по критериям GeneDoc). Трансмембранные участки выделены синим.

Упражнение № 2

На сервере TMHMM был проведен поиск трансмембранных участков по последовательности исследуемого белка. Результат работы программы — таблица с указанием границ трансмембранных участков и положения петель относительно внутренней митохондриальной мембраны, а также график (см.ниже). Координаты начала и конца трансмембранных участков были занесены в таблицу.

Судя по подписи к вертикальной оси, на ней откладывается вероятность того, что участок последовательности окажется трансмембранным, внутренним или внешним (три кривые разного цвета). Горизонтальная линия, лежащая выше этих кривых, даёт понять, какое расположение относительно мембраны для наиболее вероятно для того или иного участка белка (каждый участок этой линии имеет тот же цвет, что и кривая, лежащая на этом участке выше других кривых). Под внутренней стороной следует понимать матрикс митохондрии, а под наружной — межмембранное пространство.
По этому графическому представлению проще представить себе, какой по размеру участок последовательности занимает внешнюю или внутреннюю позицию относительно мембраны.

По невысоким пикам на графике можно предполагать наличие трансмембранных участков дополнительно к тем, которые отмечены программой в таблице и на вертикальной линии и соответствуют более высоким пикам.

Расположение предсказанных TMHMM участков было указано в том жефайле, где на последовательности отмечались найденные "почти вручную" трансмембранные участки.

Можно заметить, что не все участки, обнаруженные при работе с профилем гидрофобности, были предсказаны TMHMM.

Упражнение № 3

По результатам выполнения этого упражнения можно сказать, что данные о трансмембранных участках бычьего гомолога этого белка в базе OPM более обширны, нежели те, которые дает предсказание с помощью программы TMHMM или "почти вручную".

Все требуемые данные были добавлены к файлам отчета.

Хочется отметить, что вокруг трансмембранного сегмента, который не был предсказан ни "почти вручную", ни ТMHMM, участки с N-конца и с С-конца содержат поровну положительно заряженных аминокислотных остатков — правило "positive inside" явно неприменимо. Для следующего трансмембранного сегмента — то же самое: участки к N-концу и к C-концу содержат одинаковое число основных остатков. Обоснывавается ли упомянутое выше правило как-нибудь, кроме как эмпирически? Часто ли оно выполняется? Применимо ли оно к мембранам митохондрий и других органелл?

Без всяких правил на основании данных OPM: координат границ трансмембранных участков и картинки, на которой показана ориентация белка в мембране (см. справа) — а таже с использованием PDB-файла (1okc) можно одназначно установить границы каждой петли (совпадают с границами соответствующих трансмембранных сегментов) и с какой стороны мембраны она находится. Это и было сделано. Однако, точны ли эти данные? Белок был кристаллизован вместе с лишь небольшим колличеством мембранных липидов: в PDB-файле они не окружают этот белок со всех сторон, как это должно быть in vivo. Поэтому данные OPM могут содержать погрешности, хотя скорее всего, они незначительны.

Еще можно отметить, что те трансмембранные сегменты, которые аннотированы в базе данных, но не значились в таблице предсказаний программы TMHMM, все же могли бы быть определены с помощью того графика вероятностей, который она выдает. Там эти участки соответствуют низким (кроме одного, который имеет почти такую же высоту, как и пики, соответствующие участкам, внесённым в таблицу), но все же выраженным пикам.

Упражнение № 4

Сравнение двух методов предсказания ТМ-структуры

  По профилю гидрофобности TMHMM
Всего предсказано (N) 99 46
Из них      
  А. По данным ОРМ находятся внутри мембраны 98 43
  В. Из них - "торчащие" из мембраны остатки на концах спиралей 1 3
  С. Вообще не имеют никакого отношения к трансмембранным спиралям 0 0
D. Число непредсказанных остатков, которые по данным ОРМ находятся в мембране. 47 102
Точность предсказания, A/N 0.99 0.93
Сверхпредсказание, C/N 0 0
Недопредсказание, D/(L-N), где L-длина последовательности 0.24 0.41

"Торчащие" из мембраны остатки определялись на основании информации о вторичной структуре исследуемого белка, найденной в документе UniProt (она также есть в PDB-файле).

Не лучше ли считать недопредсказание по формуле D/(A+D)? Значение этой величины говорило бы о том, какая часть трансмембранных остатков белка не была предсказана. D/(L-N) - это доля трансмембранных остатков среди предскзанных как немембранные. Эта величина может иметь маленькое значение при большом числе пропущенных предсказанием трансмембранных остатков, если в белке много немембранных остатков (предсказывается).

Как можно судить по этим данным, в данном случае информация, полученная методом сравнения "почти вручную" была точнее и полнее, чем информация в таблице, выдаваемой программой TMHMM. Однако график, выдаваемый этой программой, гораздо полезнее, чем талбица: на нём есть пики (хотя и не все высокие), соответствующие всем трансмембранным участкам, в том числе и тому, который не может быть предсказан по профилю гидрофобности.


© Лукьянов Михаил, 2006