1) Сравнение нумерации остатков белка ACCN2_CHICK в UniProt (Q1XA76) и PDB (2QTS).
В записи 2QTS PDB представлено 6 белковых молекул (6 цепей: A, B, C, D, E, F), последовательности которых идентичны на 100% (проверено с помощью muscle).
С помощью PDBsum получено выравнивание последовательности из UniProt и PDB (цепь A). Выравнивание в msf-формате: algn1.msf .
Нумерация в 2-ух базах данных не совпадает. В PDB не представлен участок белка с 1 по 41, а также с 459 по 527 а.о. Правило перевода нумерации PDB в нумерацию UniProt: №(UniProt) = №(PDB) + 41.
2) Полное глобальное выравнивание заданного белка ACCN2_OPSTA и белка-прототипа ACCN2_CHICK.
Последовательности белков ACCN2_OPSTA и ACCN2_CHICK получены с помощью программы seqret ( accn2_opsta.fasta и accn2_chick.fasta ). Глобальное оптимальное выравнивание получено с помощью программы needle (со стандартными параметрами Gap opening penalty = 10.0, Gap extension penalty = 0.5) пакета EMBOSS: файл с выравниванием , выравнивание в fasta-формате , в msf-формате .
Параметры выравнивания:
Aligned_sequences: 2 1: ACCN2_OPSTA 2: ACCN2_CHICK Matrix: EBLOSUM62 Gap_penalty: 10.0 Extend_penalty: 0.5 Length: 529 Identity: 404/529 (76.4%) Similarity: 461/529 (87.1%) Gaps: 9/529 ( 1.7%) Score: 2237.0
3) Разметка трансмембранных сегментов в белке-прототипе ACCN2_CHICK по данным БД OPM .
Согласно классификации OPM, 2QTS имеет номер 1.1.42.01. Расшифровка:
1 - Трансмембранный белок
1.1 - Альфа-спиральный трансмембранный белок
1.1.42 - Эпителиальный натриевый канал
1.1.42.01 - Кислотно-чувствительный ионный канал
В файле 2QTS представлено 2 асимметричных тримера. Координаты трансмембранных сегментов, а также угол наклона альфа-спирали для каждой цепи тримера отличаются. Рассмотрим цепь A (нумерация переведена для UniProt, предположим, что остатки из файла UniProt, не вошедшие в структуру, не образуют трансмембранных спиралей):
из клетки -> 45-70 -> наружу
снаружи -> 427-452 -> в клетку
Большая часть белка находится за пределами клетки.
В файле mark.msf сохранено выравнивание ACCN2_OPSTA с ACCN2_CHICK, к которому добавлена строка OPM, где отмечено какие позиции белка ACCN2_CHICK относятся к трансмембранным сегментам (H), цитоплазматическим петлям (+), внеклеточным петлям (-).
4) Предсказание топологии белка ACCN2_OPSTA с помощью TMHMM .
Согласно TMHMM предсказанию , белок содержит 1 трансмембранный сегмент: из клетки-> 45-67 -> наружу. К msf-выравниванию была добавлена строчка TMHMM, содержащая эту информацию (аналогично OPM): mark_1.msf .
Интересно, что по предсказанию для белка ACCN2_CHICK, трансмембранный сегмент также один: из клетки-> 45-67 -> наружу.
Число а.к. остатков | |
Всего а.к. остатков | 522 |
Остатки, предсказанные как локализованные в мембране (всего) | 23 |
Правильно предсказали (true positives, TP) | 23 |
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 0 |
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 470 |
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 29 |
Чувствительность (sensivity) = TP / (TP+FN) | 0,43 |
Специфичность (specificity) = TN / (TN+FP) | 1 |
Точность(precision) = TP /(TP+FP) | 1 |
Сверхпредсказание = FP/ (FP+TP) | 0 |
Недопредсказание = FN / (TN+FN) | 0,058 |
Таблица расчитана с помошью Excel: таблица .
Таким образом, полученное предсказание оказалось очень специфичным и точным: все а.о., предсказанные как мембранные, действительно оказались мембранными. Однако не был предсказан 1 трансмембранный сегмент (из 2-ух существующих), что отражено в таблице в виде чувствительности и недопредсказания.