Задание 12. Поиск в PDB с расширенными параметрами (Advanced search)

Нужно было скачать все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии, в виде одного FASTA файла.
Для этого в Advanced search выбрала характеристику Experimental method и в ней - Electron Microscopy, а также Macromolecule type и Contain Protein - Yes.
В итоге нашлось 897 записей, их последовательности структур загружены в fasta-формате единым файлом.

Задание 13

Для структуры 2o14 получили два списка структурных гомологов - один скачан с сайта PDB (получен программой FATCAT), а второй с помощью сервиса PDBeFOLD (с ними можно ознакомиться в этом xlsx-файле). В первом случае в список вошли только находки с P-value < 0.001, и список был сжат через кластеризацию по 40% идентичности последовательностей. Во втором случае только одна находка имеет P-score (отрицательный логарифм P-value) не равный нулю - и это сама исходная структура. Тогда получается, что PDBeFOLD не нашел приемлемых структурных гомологов для данной структуры.


© Ходыкина Наталья, 2015