Практикум №7
Выбор белка
При выборе белка пользовался только поиском по конкретному организму: Halanaeroarchaeum sulfurireducens. В итоге выдало результат в 2,891 белков. Среди хорошо аннотированных (5-4) нашлось лишь 20. Выбрал дегидратазу дигидроксикислот, просто потому что понравилась реакция.
Информация о белке
Dihydroxy-acid dehydratase - дегидратаза дигидроксикислот. Судя по записи информации о белке, получен из нескольких штаммов: HSR2 и M27-SA2. Всего в составе 572 аминокислоты. Функция - катализирует дегидратацию 2,3-дигидрокси-3-метилпентаноата (2,3-дигидрокси-3-метилвалерат) в 2-оксо-3-метилпентаноат (2-оксо- 3-метилвалерата) и 2,3-дигидрокси-3-метилбутаноата (2,3- дигидроксиизовалерат) в 2-оксо-3-метилбутаноат (2-оксоизовалерат), предпоследний предшественник L-изолейцина и L-валина, соответственно.
Кластеры похожих белков
Поисковые запросы
Ну, для начала я попробовал поискать самую простую информацию, по названию белка,оценить его распространённость. Мне выдало 64,609 результатов, но хорошо проанализированных (из Swiss-Prot) только 582. По распространённости 99% - это бактерии,археи и эукариоты, ~1% это неклассифицированные записи и менее 1% - это вирусы. Больше всего белков в аннотациях рейтингов 3 и 1; больше всего белков длиной в 401-600 АА.
В роде Halanaeroarchaeum не нашлось представителей с таким же названием белка, но в семействе Halobacteriaceae выдало 20 результатов. Как я понял, в самом роде единственный представитель - это моя архея. В семействе же около 70 родов и 300 видов. Было интересно узнать, насколько многим организмам, близким к моему, он был свойственен.
Если искать по названию гена (ilvD) , то таких результатов 38,600, но если рассмотреть ген в семействе, то он кодирует один и тот же белок у 19 разных организмов, длина варьируется от 570 до 596 АА. Все эти организмы - археи. И вот здесь меня заинтересовала разница между результатами по семейству (20) и текущим (19). Оказалось, что у организма Salarchaeum japonicum ген называется GCM10009019_19830