С сайта UniProt при помощи расширенного поиска (Advanced в строке поиска на главной странице, графа “Taxonomy [OC]”) были найдены белки бактерии Austwickia chelonae. У данной бактерии были аннотированы 3048 белков. Я выбрала белок K6UNZ7, названный как “Diphtheria toxin receptor-binding domain-containing protein”. Как было показано в исследовании 2018 года, A. chelonae имеет токсин, близкий к дифтирийному токсину, ранее известному только в роду Corynebacterium [1,2].
Вся ключевая информация о белке представлена в файле ~/term2/pr7/protein_info.txt. Источник последовательности – TrEMBL (автоматическая база данных, содержащая, в основном,
формальные трансляции открытых рамок считывания, предсказанных в
нуклеотидных последовательностях). Полное название белка – белок, содержащий рецептор-связывающий домен дифтерийного токсина. Это значит, что эта структура – не токсин целиком, а только его часть (это также подтверждает длина белка (266 аа): исходный дифтерийный токсин состоит из 538 аминокислот [3], т.е. почти в 2 раза меньше).
Для начала проверим, имеют ли другие бактрии белок с таким же описанием. Для этого с помощью расширенного поиска введем в графу “All” полное название белка: Diphtheria toxin receptor-binding domain-containing protein. Видно, что только рассматриваемая бактерия A. chelonae имеет белок с такой функцией. Этот факт дает основание предполагать, что данные белок был приобретен бактерией недавно с помощью горизонтального переноса.
Далее проверим, имеют ли другие виды в роду Austwickia какие-либо токсины. По запросу в расширенном поиске (taxonomy_id:1184606) AND (keyword:KW-0800) никаких белков найдено не было. Вероятно, это связано с малым количеством секвенированных геномов этого рода.
Посмотрим, насколько белок длиной 266 аминокислот типичен для рассматриваемого организма. По запросу (length:[240 TO 290]) AND (taxonomy_id:100225) поиск выдает 384 результата. Это примерно 13% от всего протеома бактерии, что говорит о том, что белки такой длины встречается в клетке не так часто.