Использование сайта PDB

Задание: скачайте все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии

Было обнаружено 663 структуры белков (именно белков без нуклеиновых кислот). Результат в виде одного FASTA файла доступен по ссылке.

Задание: cравните список структурных гомологов, определенных для вашего белка (структура 3D30) программой PDBeFold с таким же списком из программы jFATCAT

В PDB был найден результат работы алгоритма jFATCAT. Показаны только результаты с P-value < 0.001, также установлен порог на идентичность последовательностей 40%. Обнаружено 153 гомолога для одного домена и 35 для другого. В PDBeFold был выбран параметр "best matches only", чтобы примерно соотвествовать поиску jFATCAT с порогом P-value 0.001. Порог на сходство структур 70%. В результате обнаружено всего 18 структур. Есть 4 совпадения среди результатов jFATCAT и PDBeFold (на самом деле два, просто для двух разых доменов совпадения в одинаковых структурах). Результат работы можно посмотреть в таблице по ссылке. Стоит отметить, что при пороге на сходство структур 40% находится примерно 1500 структур, и 29 из них совпадают с обнаруженными jFATCAT. Если верить, что параметры поиска в первом случае были примерно одинаковые (а скорее всего для гибкого они жестче), то неудивительно, что гибкое выравнивание дало больше результатов, чем жесткое. Также неудивительно, что большинство из них не совпало с жестким выравниванием, как я понимаю введение возможности поворота увеличивает вероятность найти гомологичную структуру среди некоего набора.


© Анисимова Александра, 2015