Скачали все последовательности белков в PDB, структуры которых определены при помощи метода электронной микроскопии, в виде одного FASTA файла. Использовали Advanced Search: выбрали Experimental method - ELECTRON MICROSCOPY.
Ссылка на файл со всеми последовательностями
Получили списки структурных гомологов, определенных для 4j3c программой PDBeFold и программой jFATCAT. Последний список (jFATCAT) есть прямо на странице PDB этой структуры.
Structural Similarities for the Entities in PDB 4J3C
Чтобы уменьшить количество находок, программа использовала кластеризацию по 40% идентичности и выбирала репрезентативную цепь из каждого кластера. Для цепи A структуры 4j3c нашли 34 гомолога при P-value < 0.001.
Ссылка на файл Excel для находок jFATCAT
С помощью PDBeFold с параметрами "best matches only" и порогом на сходство - 70% нашлось 19 гомологов цепи A 4j3c, включая обе цепи 4j3c.
Ссылка на файл выдачи PDBeFold
Гибкое выравнивание jFATCAT дало находки из более далеких семейств: в выдаче PDBeFold видим в основном метилтрансферазы и гипотетические белки, а jFATCAT дал различные изомеразы, факторы и другие по функциям белки, например, гликопротеин фибронектин. Некоторые из найденных структур повторялись в выдачах PDBeFold и jFATCAT, но из-за неудобной выдачи jFATCAT (есть ссылки на структуры и названия доменов, но нет названий структур в списке) не получилось как-то обобщить сравнение.