Мембранные белки, транспортные белки

Открыл домашнюю страничку БД PDBsum, предоставляющей краткое схематическое отображение информации о структуре. Нашел документ с идентификатором PDB 3H90. Получиk окно с выравниванием последовательности из UniProt и последовательности из PDB.
Импортировал выравнивание в Genedoc и сохранил как файл algn1.msf

Нумерация двух баз данных отличается, начало и конец базы данных Uniprot длинее на 7 а.о и 10 а.о соответственно.

 

Было проведено глобальное выравнивание FIEF_PECCP и FIEF_ECOLI

Последовательности заданных белков: FIEF_PECCP и FIEF_ECOLI

Для этого применял программу needle пакета EMBOSS

needle rec.fasta ec.fasta virovn.msf -aformat msf

Файл, выданный программой needle скачать

Полученное выравнивание cкачать

 

Открыл домашнюю страничку БД ОРМ, по PDB ID нашел описание ТМ-сегментов в белке-прототипе 3H90.
Импортировал созданное в предыдущем упражнении выравнивание в Genedoc. Под строчкой с выровненной последовательностью белка-прототипа поместил строчку с разметкой трансмембранных сегментов: 1(17-30).2(42-58), 3(82-103), 4(118-135), 5(149-158), 6(179-198). Для определения в какую сторону обращены петели, использовал модель, создванную в Jmol.

Сохранил все в файле mark.msf

 

Предсказания топологии FIEF_PECCP с помощью сервера TMHMM.

Просмотр


Добавил к последовательностям в файле mark.msf еще одну искусственную последовательность с разметкой трансмембранных спиралей в соответствии с результатами предсказания.

Скачать

 

Число а.к. остатков
Всего а.к. остатков
300
Остатки, предсказанные как локализованные в мембране (всего)
92
Правильно предсказали (true positives, TP)
69
Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP)
23
Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN)
177
Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN)
31
Чувствительность (sensivity) = TP / (TP+FN)
0,69
Специфичность (specificity) =  TN / (TN+FP) 
0,885
Точность(precision) = TP /(TP+FP)
0,75
Сверхпредсказание = FP/ (FP+TP)
0,25
Недопредсказание = FN / (TN+FN)
0,15

Файл с расчетом

Резюмируя, можно сказать, что качество предсказание методом TMHMM высокое, т к велика специфичность и чувствительность, а процент недопрдсказаний 15%. Однако этод метод не предсказал два трансмембранных сегмента 5(149-158), 6(179-198). НО, если посмотреть каринку полученную методом TMHMM, то можно заметить два пика, которые скорее всего соответствуют 5 и 6 сегменту, а так как их вероятность приблизительно равно 80%, программа TMHMM не внесла их в список трансмембранных сегментов.

 

 

© Замараев Алексей