Главная | Проекты | Семестры |
- Построить выравнивание заданного белка ARPB_PSEPU и белка-прототипа MEXB_PSEAE с разметкой трансмембранных сегментов.
- Сравнить нумерацию остатков белка-прототипа в UniProt и PDB Файл msf с выравниванием последовательности по данным UniProt и PDB (PDB ID: 2V50).
Нумерация не совпадает, т. к. не полностью совпадают последовательности. Правило перевода нумерации PDB (N1) в нумерацию UniProt (N2):N2=N1+3, N1<497 N2=N1+15, 496- Постройте полное глобальное выравнивание заданного белка и белка-прототипа. C помощью needle было получено глобальное выравнивание белков ARPB_PSEPU и MEXB_PSEAE.
Выходной файл aln.needle- Создать по данным БД ОРМ разметку трансмембранных сегментов в белке-прототипе. По данным БД ОРМ, по PDB ID 2V50 было найдено описание ТМ-сегментов в белке-прототипе.
Под строчкой с выровненной последовательностью белка-прототипа в выравнивании из задания 1.2 в GeneDoc добавлена строчка (OPM) с разметкой трансмембранных сегментов.
файл mark.msf
картинка из GeneDoc с раскрашенными доменами.
Легенда:
-, раскрашено голубым.............цитоплазматические петли
H, раскрашено зеленым.............трансмембранные домены
+, раскрашено розовым.............внеклеточные петли
- Предсказать топологию заданного белка с помощью наиболее популярной программы (TMHMM) Страница с результатом предсказания.
Эти результаты так же отображены в файле msf, ссылка на который дана в предыдущем задании (последовательность "TMHMM", обозначения те же).- Сравните полученное предсказание с данными ОРМ. Скрипт был написан на Perl.
Результаты предсказания топологии мембранного белка ARPB_PSEPU
Из таблицы видно, что у метода хорошие показатели специфичности и чувствительности, то низковата точность и достаточно большое сверхпредсказание. Предсказано 11 трансмембранных спиралей, в то время как на самом деле у белка их 12. Из-за этого ориентация части белка (~1-390) предсказана правильно, но непредсказанная 4-ая ТМ-спираль (394- 411) "инвертировала" всю оставшуюся часть белка относительно мембраны.
Число а.к. остатков Всего а.к. остатков 1050 Остатки, предсказанные как локализованные в мембране (всего) 248 Правильно предсказали (true positives, TP) 188 Предсказали не то, что нужно (а.о. предсказаны как мембранные, а по данным ОРМ таковыми не являются, false positives, FP) 51 Правильно не предсказали ( не предсказаны, и по данным ОРМ не находятся в мембране, true negatives, TN) 775 Не предсказали то, что нужно (остатки по данным ОРМ находятся в мембране, false negatives, FN) 36 Чувствительность (sensivity) = TP / (TP+FN) 0.839 Специфичность (specificity) = TN / (TN+FP) 0.938 Точность(precision) = TP /(TP+FP) 0.787 Сверхпредсказание = FP/ (FP+TP) 0.213 Недопредсказание = FN / (TN+FN) 0.044