Главная
На страничке БД PDBsum,
предоставляющей краткое схематическое отображение информации о структуре, находим документ с идентификатором PDB 2ZW3.
Получили выравнивание последовательности из UniProt и последовательности из PDB.
Импортировали выравнивание в Genedoc: pdbsum.msf.

Нумерация в 2-х БД совпадает.
Получили последовательности белков для выравнивания из UniProt:
cxb2_rat.fasta, cxb2_human.fasta
Глобальное выравнивание построили с помощью программы needle: tm.needle
CXB2_HUMAN 1 MDWGTLQTILGGVNKHSTSIGKIWLTVLFIFRIMILVVAAKEVWGDEQAD 50
|||||||:||||||||||||||||||||||||||||||||||||||||||
CXB2_RAT 1 MDWGTLQSILGGVNKHSTSIGKIWLTVLFIFRIMILVVAAKEVWGDEQAD 50
CXB2_HUMAN 51 FVCNTLQPGCKNVCYDHYFPISHIRLWALQLIFVSTPALLVAMHVAYRRH 100
||||||||||||||||||||||||||||||||.|||||||||||||||||
CXB2_RAT 51 FVCNTLQPGCKNVCYDHYFPISHIRLWALQLIMVSTPALLVAMHVAYRRH 100
CXB2_HUMAN 101 EKKRKFIKGEIKSEFKDIEEIKTQKVRIEGSLWWTYTSSIFFRVIFEAAF 150
||||||:|||||:||||||||||||||||||||||||:||||||||||.|
CXB2_RAT 101 EKKRKFMKGEIKNEFKDIEEIKTQKVRIEGSLWWTYTTSIFFRVIFEAVF 150
CXB2_HUMAN 151 MYVFYVMYDGFSMQRLVKCNAWPCPNTVDCFVSRPTEKTVFTVFMIAVSG 200
|||||:||:||.|||||||||||||||||||:||||||||||||||:|||
CXB2_RAT 151 MYVFYIMYNGFFMQRLVKCNAWPCPNTVDCFISRPTEKTVFTVFMISVSG 200
CXB2_HUMAN 201 ICILLNVTELCYLLIRYCSGKSKKPV 226
||||||:||||||.|||||||||:||
CXB2_RAT 201 ICILLNITELCYLFIRYCSGKSKRPV 226
Идентичность: 212/226 (93.8%)
Сходство: 222/226 (98.2%)
Гэпов нет
Описание белка:
* Тип: 1. трансмембранный белок (2 classes)
* Класс: 1.1. Альфа-спиральный трансмембранный белок (57 superfamilies)
* Суперсемейство: 1.1.52. Коннексин, формирующий щелевые контакты (нексусы) (1 family) 1.A.24 (TCDB)
* Семейство: 1.1.52.01. Коннексин (1 protein) 1.A.24 (TCDB)
* Виды: Spodoptera frugiperda (1 protein)
* Локализация: Плазматическая мембрана эукариот (199 proteins)
Белок состоит из 6 суъединиц, в каждой из которых
найдено 6 трансмембранных сегментов.
A - Tilt: 20° - Segments: 1( 22- 45), 2( 73- 91), 3( 137- 157), 4( 187- 211) B - Tilt: 19° - Segments: 1( 22- 45), 2( 73- 91), 3( 137- 157), 4( 187- 211) C - Tilt: 19° - Segments: 1( 22- 45), 2( 73- 91), 3( 137- 157), 4( 187- 211) D - Tilt: 19° - Segments: 1( 22- 45), 2( 73- 91), 3( 137- 157), 4( 187- 211) E - Tilt: 19° - Segments: 1( 22- 45), 2( 73- 91), 3( 137- 157), 4( 187- 211) F - Tilt: 19° - Segments: 1( 22- 45), 2( 73- 91), 3( 137- 157), 4( 187- 211)Интересно, что изображение в Jmol показывает фрагмент 1-8 аминокислоты как трансмембранный, тогда как по данным OPM это не так.
Разметка была сделана согласно OPM: позиции мембранных сегментов отмечены буквой "Н", позиции цитоплазматических петель знаком "+", остальные — знаком "-".
Выравнивание сохранено в файл: mark.msf

Оранжевым раскрашены цитоплазматические позиции, зеленым - трансмембранные сегменты, желтым - последовательность, которой нет в OPM и PDBsum, остальное - серым.
| Всего а.к. остатков | 226 |
| Остатки, предсказанные как локализованные в мембране (всего) | 89 |
| Правильно предсказали (true positives, TP) | 72 |
| Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) | 17 |
| Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) | 120 |
| Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) | 17 |
| Чувствительность (sensivity) = TP / (TP+FN) | 80,9% |
| Специфичность (specificity) = TN / (TN+FP) | 87,5% |
| Точность(precision) = TP /(TP+FP) | 80,9% |
| Сверхпредсказание = FP/ (FP+TP) | 19,1% |
| Недопредсказание = FN / (TN+FN) | 12,4% |
На мой взгляд не следует считать данное предсказание качественным.
Ошибки первого рода и второго рода (FP и FN соответственно) одинаковы, что бывает не часто, притом достаточно велики, в результате чего чувствительность и точность имеют средние показатели.
Высокий процент сверхпредсказания и недопредсказания. Хороший уровень специфичности, что обусловило отсутствие неверных трансмембранных спиралей.
Несмотря на средние показатели, все трансмембранные спирали предсказаны верно, хоть и не полностью, ориентация белка в мембране также сохранена.