UniProt

Выбор белка

С помощью advance search, был сделан выбор в пользу белка Chaperone protein DnaK в базе данных UniProt.Для исследования был выбран AC-A0A831NYL2. Условиями для расширенного поиска выступили: достоверность по транскрипции.

(taxonomy_id:1076588) AND (existence:2)

Результатом посика было выдано 7 потенциальных белков. Выбранный мной белок не является самым цитированным, но приглянулся мне, потому что эволюция шаперонов тесно связана с эволюцией белка в целом и пространственная организация белка играет важную роль в его функционировании.

Белок-шаперон DnaK участвует в фолдинге,предотвращает агрегацию белков и участвует в растворении белковых агрегатов. В структуре шаперона имеется сайт связывания субстрата, АТФазный домен и междоменный линкер.

Поисковые запросы

Для начала проведем поиск ортологов белка у Гаммапротеобактерий, т.к. мой белок принадлежит гаммапротеобактерии Thiolapillus brandeum.

(protein_name:"Chaperone protein dnaK") AND (taxonomy_id:1236)

Обнаруживается 7271 результат, но не все из них релевантны, например белок

Имеет 25 аминокислот, в то время как большинство ортологов имеют более 600 аминокислот. Скорее всего он является артефактом базы данных.

Ограничение по длине в 600 - 700 аминокислот:

(protein_name:"Chaperone protein dnaK") AND (taxonomy_id:1236) AND (length:[600 TO 700])

Дает 6703 результата. Дополнительно ограничим Evidence at transcript level, чтобы отсеять белки с неустановленным транскриптом. 6453 результата.

(protein_name:"Chaperone protein dnaK") AND (taxonomy_id:1236) AND (length:[600 TO 700]) AND ((existence:2) OR (existence:1))

Если теперь снять ограничение на длину, то можно увидеть, что сверхкороткие белки исчезли. Самый короткий белок будет состоять из 578 аминокислот, а самый длинный из 736