1. Выбор белка
Запрос:
(organism_id:226186) AND (existence:1) AND (keyword:KW-0449)
13 совпадений.
Запрос составлен так, тк интересуют поверхностные липопротеины Sus (Starch Utilization System).
Соответсвенно в одну биологическую единицу входит одна цепь, А.
2. Информация о белке
ID:SUSD_BACTN
AC:Q8A1G2,Q45770
Version:118
Name:Starch-binding protein SusD
TaxID:226186
INSDC:L77614,AE015928
Length:551
MW:62309
Функция: крахмал-связывающий мембранный липопротеин. Он опосредует связывание крахмала перед его транспортировкой в периплазму для деградации.
3. Кластеры похожих белков
Size:2
Length:551
Name:Starch-binding protein SusD
ID:UniRef90_Q8A1G2
Size:77
Length:551
Name:Single-stranded DNA-binding protein DdrB
ID:UniRef50_Q8A1G2
Size:427
Length:551
Name:Starch-binding protein SusD
В целом можно сказать, что данный белок является весьма распространенным, тк даже при 90% сходстве мы наблюдаем кластер из нескольких десятков белков.
4. Поисковые запросы
1. Ищем кластеры
Идея: посмотреть кластеры данного белка, не содержащие род Bacteroides ( взяла B. thetaiotaomicron как типового представителя рода)
Запрос: (name:"Starch-binding protein SusD") NOT (taxonomy_id:818) AND (identity:0.9)
Результат: 101 кластер, из них самые большие:
UniRef90_A0A250KEF2 (90%) 41 элемент, представители рода Prevotella, принадлежат с Bacteroides к одному отряду Bacteroidales.
Также при identity:1.0 было найдено 115 “кластеров”, из них максимальный размер в 2 белка было в 23. Филогенитически в одной филе (phylum)
А может, есть кластер с идентичными на 100% белками, которые также хотя бы на 50% идентичны нашему белку? – таких нет(
А на 90%?
(name:"Starch-binding protein SusD") NOT (taxonomy_id:816) AND (identity:0.9) AND (count:[2 TO 3]) AND (cluster:UniRef50_Q8A1G2)
Да, и снова в филогенетически близкой Prevotella обнаружен 1 кластер из 2 белков.
А если поискать кластеры со схожестью на 90% и входящие в кластер UniRef50_Q8A1G2?
(name:"Starch-binding protein SusD") AND (identity:0.9) AND (cluster:UniRef50_Q8A1G2)
2 кластера, UniRef90_Q8A1G2 и другой с Prevotella UniRef90_A0A9R1CBY9.
А 50% и 50%?
(name:"Starch-binding protein SusD") AND (identity:0.5) AND (cluster:UniRef50_Q8A1G2)
– неожиданно не нашлось таких кластеров, хотя я ожидала, что их будет много