Задача 1: Скачайте все последовательности белков, структуры которых определенны при помощи метода электронной микроскопии, в виде одного FASTA файла. Используйте Advanced search.
Параметр поиска: Experimental Method is ELECTRON MICROSCOPY
Найдено структур: 917
Последовательности белков в одном FASTA файле: seq.fasta
Задача 2: Сравните список структурных гомологов, определенных для вашего белка программой PDBeFold с таким же списком из программы jFATCAT. Последний список есть прямо на странице PDB.
Список из PDBeFold: reslist.dat
Список из jFATCAT в PDB: jFATCAT.xlsx
В PDBeFold найдено 208 записей, в то время как в jFATCAT с порогом на p-value 10-6 – 558. Всего лишь 9 записей из PDBeFold найдены в jFATCAT.