Мембранные белки.


1. Построение парного выравнивания исследуемого белка и заданного прототипа

В БД Uniprot по AC P60844 была найдена последовательность аквапорина (AQPZ_ECOLI). В БД PDB была найдена последовательность этого же белка (PDB 1RC2). В БД PDB были найдены две цепи 1RC2:A и 1RC2:B. Я построил выравнивание этих цепей и увидел, что они одинаковы. Затем построил выравнивание AQPZ_ECOLI и 1RC2:A. Получившееся выравнивание имеет сходство 100%. Выравнивание приведено внизу страницы.

В БД Uniprot получил последовательность изучаемого белка - A2WE20_9BURK – Глицериновый канал.
Сделал выравнивание с помощью программы needle со стд параметрами. Получил довольно большой процент сходства: 64.7%.
Выравнивание импортировал в GeneDoc. Сохранила под названием mrking.msf

 

2. Разметка мембранных сегментов на выравнивании.

В БД OPM (Orientations of Proteins in Membranes database) по PDB –“1RC2”-белка-прототипа  нашел описание ориентации белка в мембране. В файле mrking.msf под последовательностями исследуемого белка и белка-прототипа добавил последовательность с названием "OPM". Отметил позиции мембранных сегментов буквой "Н", позиции цитоплазматических петель знаком "+", остальные — знаком "-".

3. Предсказание топологии заданного белка с помощью наиболее популярной программы (TMHMM)

 

Чтобы предсказать топологию, на вход программе была подана последовательность моего исследуемого белка в fasta-формате. Программа выдала следующий вариант локализации белка в мембране:

 

 

К последовательностям в файле mrking.msf добавил еще одну последовательность "TMHMM", которая отражает результаты данного предсказания.

 

 

 

В самом конце страницы приведен файл mrking.aln

 

4. Оценка качества предсказания

Результаты предсказания топологии мембранного белка аквапорина (AQPZ_ECOLI)

 

Число а.к. остатков

Всего а.к. остатков

306

Остатки, предсказанные как локализованные в мембране (всего)

135

Правильно предсказали (true positives, TP)

113

Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)

22

Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)

134

Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)

36

Чувствительность (sensivity) = TP / (TP+FN)

0,758

Специфичность (specificity) =  TN / (TN+FP) 

0,858

Точность (precision) = TP / (TP+FP)                       

0,859

Сверхпредсказание = FP/ (FP+TP)     

0,162

Недопредсказание = FN / (TN+FN)                                           

0,211

 

Результаты анализа сравнения показывают, что программа TMHMM неплохо справилась с поставленной задачей: значения для чувствительности и специфичности превышают 75.8% и 85,8% соответственно. А сверх- и недопредсказание составляют порядка 16-21%. Таким образом, программа довольно четко указала границы найденных сегментов.

 

Выравнивание AQPZ_ECOLI и 1RC2:A:

 

#=======================================

#

# Aligned_sequences: 2

# 1: 1RC2

# 2: AQPZ_ECOLI

# Matrix: EBLOSUM62

# Gap_penalty: 10.0

# Extend_penalty: 0.5

#

# Length: 231

# Identity:     231/231 (100.0%)

# Similarity:   231/231 (100.0%)

# Gaps:           0/231 ( 0.0%)

# Score: 1185.0

#

#

#=======================================

 

1RC2               1 MFRKLAAECFGTFWLVFGGCGSAVLAAGFPELGIGFAGVALAFGLTVLTM     50

                     ||||||||||||||||||||||||||||||||||||||||||||||||||

AQPZ_ECOLI         1 MFRKLAAECFGTFWLVFGGCGSAVLAAGFPELGIGFAGVALAFGLTVLTM     50

 

1RC2              51 AFAVGHISGGHFNPAVTIGLWAGGRFPAKEVVGYVIAQVVGGIVAAALLY    100

                     ||||||||||||||||||||||||||||||||||||||||||||||||||

AQPZ_ECOLI        51 AFAVGHISGGHFNPAVTIGLWAGGRFPAKEVVGYVIAQVVGGIVAAALLY    100

 

1RC2             101 LIASGKTGFDAAASGFASNGYGEHSPGGYSMLSALVVELVLSAGFLLVIH    150

                     ||||||||||||||||||||||||||||||||||||||||||||||||||

AQPZ_ECOLI       101 LIASGKTGFDAAASGFASNGYGEHSPGGYSMLSALVVELVLSAGFLLVIH    150

 

1RC2             151 GATDKFAPAGFAPIAIGLALTLIHLISIPVTNTSVNPARSTAVAIFQGGW    200

                     ||||||||||||||||||||||||||||||||||||||||||||||||||

AQPZ_ECOLI       151 GATDKFAPAGFAPIAIGLALTLIHLISIPVTNTSVNPARSTAVAIFQGGW    200

 

1RC2             201 ALEQLWFFWVVPIVGGIIGGLIYRTLLEKRD    231

                     |||||||||||||||||||||||||||||||

AQPZ_ECOLI       201 ALEQLWFFWVVPIVGGIIGGLIYRTLLEKRD    231

 

#---------------------------------------

#---------------------------------------

 

mrking.aln

 

 

 

 

CLUSTAL W(1.60) multiple sequence alignment

 

 

 

A2WE20_9BURK    MVHSDRAQLVEHLCVLIVLRAARASQNRRLEIHPALPIQQGRGLLDCRSDGSNLEGANMS

1RC2            ----------------------------------------------------------MF

OPM             ----------------------------------------------------------++

TMHMM           ++++++++++++++++++++++++++++++++++++++++++++++++++++++++++++

 

 

A2WE20_9BURK    NRLAAEAFGTFWLVLGGCGSAVLAAAPTPQSGIGMAGVALAFGLTVLTMAYAVGHISGAH

1RC2            RKLAAECFGTFWLVFGGCGSAVLAAG-FPELGIGFAGVALAFGLTVLTMAFAVGHISGGH

OPM             +HHHHHHHHHHHHHHHHHHHHHHH--------HHHHHHHHHHHHHHHHHHHHHH++++++

TMHMM           +++++++HHHHHHHHHHHHHHHHHHHH---------HHHHHHHHHHHHHHHHHHHHHHH+

 

 

A2WE20_9BURK    FNPAVTVGLWAGGRFNSKDVVPYIVAQVIGGIAAAAVLYGIASGKAGFSATDTGFAANGF

1RC2            FNPAVTIGLWAGGRFPAKEVVGYVIAQVVGGIVAAALLYLIASGKTGFDAAASGFASNGY

OPM             ++HHHHHHHHHH-------HHHHHHHHHHHHHHHHHHHHHH+++++++++++++++++++

TMHMM           +++++++++++++++++++HHHHHHHHHHHHHHHHHHHHHHH------------------

 

 

A2WE20_9BURK    GEHSPAGYGLSAAILSEFVLTAFFVIVIHGATDERAPKGFAPIAIGLALTLIHLISIPVT

1RC2            GEHSPGGYSMLSALVVELVLSAGFLLVIHGATDKFAPAGFAPIAIGLALTLIHLISIPVT

OPM             +++++++++HHHHHHHHHHHHHHHHHHHHHH--------HHHHHHHHHHHHHHHHHH+++

TMHMM           ------HHHHHHHHHHHHHHHHHHHHHHH++++++++++HHHHHHHHHHHHHHHHHHHHH

 

 

A2WE20_9BURK    NTSVNPARSTAVAIFQGTWALHQLWLFWVVPIAGGVIGGFVYRFLFGQKSDAPAVAAAAA

1RC2            NTSVNPARSTAVAIFQGGWALEQLWFFWVVPIVGGIIGGLIYRTLL-EKRD---------

OPM             +++++HHHHHHHHHH----HHHHHHHHHHHHHHHHHHHHHHH++++++++++++++++++

TMHMM           HHH--------------------HHHHHHHHHHHHHHHHHHHHHHH++++++++++++++

 

 

A2WE20_9BURK    DASAAQ

1RC2            ------

OPM             ++++++

TMHMM           ++++++

 


На главную страницу четвертого семестра

На главную


© Кузеванов Алексей,2005