назад

Выравнивание заданного белка ACCN2_OPSTA и белка-прототипа ACCN2_CHICK с разметкой трансмембранных сегментов.

1) Сравнение нумерации остатков белка ACCN2_CHICK в UniProt (Q1XA76) и PDB (2QTS).

В записи 2QTS PDB представлено 6 белковых молекул (6 цепей: A, B, C, D, E, F), последовательности которых идентичны на 100% (проверено с помощью muscle).

С помощью PDBsum получено выравнивание последовательности из UniProt и PDB (цепь A). Выравнивание в msf-формате: algn1.msf .

Нумерация в 2-ух базах данных не совпадает. В PDB не представлен участок белка с 1 по 41, а также с 459 по 527 а.о. Правило перевода нумерации PDB в нумерацию UniProt: №(UniProt) = №(PDB) + 41.

2) Полное глобальное выравнивание заданного белка ACCN2_OPSTA и белка-прототипа ACCN2_CHICK.

Последовательности белков ACCN2_OPSTA и ACCN2_CHICK получены с помощью программы seqret ( accn2_opsta.fasta и accn2_chick.fasta ). Глобальное оптимальное выравнивание получено с помощью программы needle (со стандартными параметрами Gap opening penalty = 10.0, Gap extension penalty = 0.5) пакета EMBOSS: файл с выравниванием , выравнивание в fasta-формате , в msf-формате .

Параметры выравнивания:

 
   Aligned_sequences: 2
   1: ACCN2_OPSTA
   2: ACCN2_CHICK
   Matrix: EBLOSUM62
   Gap_penalty: 10.0
   Extend_penalty: 0.5
  
   Length: 529
   Identity:     404/529 (76.4%)
   Similarity:   461/529 (87.1%)
   Gaps:           9/529 ( 1.7%)
   Score: 2237.0
    

3) Разметка трансмембранных сегментов в белке-прототипе ACCN2_CHICK по данным БД OPM .

Согласно классификации OPM, 2QTS имеет номер 1.1.42.01. Расшифровка:
1 - Трансмембранный белок
1.1 - Альфа-спиральный трансмембранный белок
1.1.42 - Эпителиальный натриевый канал
1.1.42.01 - Кислотно-чувствительный ионный канал

В файле 2QTS представлено 2 асимметричных тримера. Координаты трансмембранных сегментов, а также угол наклона альфа-спирали для каждой цепи тримера отличаются. Рассмотрим цепь A (нумерация переведена для UniProt, предположим, что остатки из файла UniProt, не вошедшие в структуру, не образуют трансмембранных спиралей):
из клетки -> 45-70 -> наружу
снаружи -> 427-452 -> в клетку
Большая часть белка находится за пределами клетки.

В файле mark.msf сохранено выравнивание ACCN2_OPSTA с ACCN2_CHICK, к которому добавлена строка OPM, где отмечено какие позиции белка ACCN2_CHICK относятся к трансмембранным сегментам (H), цитоплазматическим петлям (+), внеклеточным петлям (-).

4) Предсказание топологии белка ACCN2_OPSTA с помощью TMHMM .

Согласно TMHMM предсказанию , белок содержит 1 трансмембранный сегмент: из клетки-> 45-67 -> наружу. К msf-выравниванию была добавлена строчка TMHMM, содержащая эту информацию (аналогично OPM): mark_1.msf .

Интересно, что по предсказанию для белка ACCN2_CHICK, трансмембранный сегмент также один: из клетки-> 45-67 -> наружу.

Сравните полученное предсказание с данными ОРМ для ACCN2_OPSTA.

  Число а.к. остатков
Всего а.к. остатков 522
Остатки, предсказанные как локализованные в мембране (всего) 23
Правильно предсказали (true positives, TP) 23
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 0
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 470
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 29
Чувствительность (sensivity) = TP / (TP+FN) 0,43
Специфичность (specificity) =  TN / (TN+FP)  1
Точность(precision) = TP /(TP+FP) 1
Сверхпредсказание = FP/ (FP+TP) 0
Недопредсказание = FN / (TN+FN) 0,058

Таблица расчитана с помошью Excel: таблица .

Таким образом, полученное предсказание оказалось очень специфичным и точным: все а.о., предсказанные как мембранные, действительно оказались мембранными. Однако не был предсказан 1 трансмембранный сегмент (из 2-ух существующих), что отражено в таблице в виде чувствительности и недопредсказания.