При выборе белка пользовался только поиском по конкретному организму:
Halanaeroarchaeum sulfurireducens. В итоге выдало результат в 2,891
белков. Среди хорошо аннотированных (5-4) нашлось лишь 20. Выбрал
дегидратазу дигидроксикислот, просто потому что понравилась реакция.
Информация о белке
Dihydroxy-acid dehydratase - дегидратаза дигидроксикислот. Судя по записи
информации о белке, получен из нескольких штаммов: HSR2 и M27-SA2. Всего в
составе 572 аминокислоты. Функция - катализирует дегидратацию
2,3-дигидрокси-3-метилпентаноата (2,3-дигидрокси-3-метилвалерат) в
2-оксо-3-метилпентаноат (2-оксо- 3-метилвалерата) и
2,3-дигидрокси-3-метилбутаноата (2,3- дигидроксиизовалерат) в
2-оксо-3-метилбутаноат (2-оксоизовалерат), предпоследний предшественник
L-изолейцина и L-валина, соответственно.
Кластеры похожих белков
Поисковые запросы
Ну, для начала я попробовал поискать самую простую информацию, по названию
белка,оценить его распространённость. Мне выдало 64,609 результатов, но
хорошо проанализированных (из Swiss-Prot) только 582. По
распространённости 99% - это бактерии,археи и эукариоты, ~1% это
неклассифицированные записи и менее 1% - это вирусы. Больше всего белков в
аннотациях рейтингов 3 и 1; больше всего белков длиной в 401-600 АА.
В роде Halanaeroarchaeum не нашлось представителей с таким же названием
белка, но в семействе Halobacteriaceae выдало 20 результатов. Как я понял,
в самом роде единственный представитель - это моя архея. В семействе же
около 70 родов и 300 видов. Было интересно узнать, насколько многим
организмам, близким к моему, он был свойственен.
Если искать по названию гена (ilvD) , то таких результатов 38,600, но если
рассмотреть ген в семействе, то он кодирует один и тот же белок у 19
разных организмов, длина варьируется от 570 до 596 АА. Все эти организмы -
археи. И вот здесь меня заинтересовала разница между результатами по
семейству (20) и текущим (19). Оказалось, что у организма Salarchaeum
japonicum ген называется GCM10009019_19830