Из предложенных белков я выбрал белок с индексом P39450, этим белком оказалась S-(гидроксиметил)глутатион дегидрогеназа из организма Photobacterium damselae.
Данный фермент катализирует следующую реакцию:
S-(hydroxymethyl)glutathione + NAD(P)+ ⇌ S-formylglutathione + NAD(P)H + H+
Далее я запустил алгоритм PSI-BLAST по данному белку, всего 4 итерации, изначально я пробовал запустисть со стандартным пороговым значение в 5*10^-3, однако подобный порог не дал скачка в E-value ни в одной из итераций, поэтому я понизил порог до 5*10^-4. Результаты приведены в таблице:
После четвертой итерации скачок E-value исчез, на основании этого предполагаю, что все дальнейшие находики которые будут встраиваться врядли являются частью одного семейства гомологичных белков с искомым. В пятой и шестой итерациях E-value худшего значения в выборке больше не менялся. На первых двух итерациях список находок состоит исключительно из различных дегидрогеназ и других оксидоредуктаз, на 3 итерации внезапно возникают несколько метил-трансфераз. Несмотря на то, что по итогу мы получили сходимость по E-value, сложно сказать можно ли объединить эти белки в единое семейство, если это все наши находки действительно составляют единое семейство белков, то выходит что это семейство очень разнообразно (в конце концов у нас почти тысяча находок), поэтому я считаю, что данное семейство является не самым лучшим для идентификации вероятностными методами.