учебная страница панькиной вари

Практикум 7. UniProt

1. Выбор белка

Запрос:

(organism_id:226186) AND (existence:1) AND (keyword:KW-0449)
13 совпадений.
Запрос составлен так, тк интересуют поверхностные липопротеины Sus (Starch Utilization System).

Соответсвенно в одну биологическую единицу входит одна цепь, А.

2. Информация о белке

Database:Swiss-Prot
ID:SUSD_BACTN
AC:Q8A1G2,Q45770
Version:118
Name:Starch-binding protein SusD
TaxID:226186
INSDC:L77614,AE015928
Length:551
MW:62309

Функция: крахмал-связывающий мембранный липопротеин. Он опосредует связывание крахмала перед его транспортировкой в ​​периплазму для деградации.

3. Кластеры похожих белков

ID:UniRef100_Q8A1G2
Size:2
Length:551
Name:Starch-binding protein SusD

ID:UniRef90_Q8A1G2
Size:77
Length:551
Name:Single-stranded DNA-binding protein DdrB

ID:UniRef50_Q8A1G2
Size:427
Length:551
Name:Starch-binding protein SusD

В целом можно сказать, что данный белок является весьма распространенным, тк даже при 90% сходстве мы наблюдаем кластер из нескольких десятков белков.

4. Поисковые запросы

1. Ищем кластеры

Идея: посмотреть кластеры данного белка, не содержащие род Bacteroides ( взяла B. thetaiotaomicron как типового представителя рода) Запрос: (name:"Starch-binding protein SusD") NOT (taxonomy_id:818) AND (identity:0.9) Результат: 101 кластер, из них самые большие:
UniRef90_A0A250KEF2 (90%) 41 элемент, представители рода Prevotella, принадлежат с Bacteroides к одному отряду Bacteroidales.
Также при identity:1.0 было найдено 115 “кластеров”, из них максимальный размер в 2 белка было в 23. Филогенитически в одной филе (phylum)
А может, есть кластер с идентичными на 100% белками, которые также хотя бы на 50% идентичны нашему белку? – таких нет(
А на 90%? (name:"Starch-binding protein SusD") NOT (taxonomy_id:816) AND (identity:0.9) AND (count:[2 TO 3]) AND (cluster:UniRef50_Q8A1G2) Да, и снова в филогенетически близкой Prevotella обнаружен 1 кластер из 2 белков.
А если поискать кластеры со схожестью на 90% и входящие в кластер UniRef50_Q8A1G2? (name:"Starch-binding protein SusD") AND (identity:0.9) AND (cluster:UniRef50_Q8A1G2) 2 кластера, UniRef90_Q8A1G2 и другой с Prevotella UniRef90_A0A9R1CBY9.
А 50% и 50%? (name:"Starch-binding protein SusD") AND (identity:0.5) AND (cluster:UniRef50_Q8A1G2) – неожиданно не нашлось таких кластеров, хотя я ожидала, что их будет много