База данных UniProt
В данном практикуме проходило знакомство с базой данных по белкам UniProt, с организацией информации в ней и способами ее поиска.
Получение информации о белке GSHAB_PASMU
В поисковый запрос был введен GeneBankID рассматриваемого белка, результат был переведен в текстовый файл, из которого была получена информация, приведенная в Таблице 1.
UniProt ID | GSHAB_PASMU |
---|---|
UniProt AC | Q9CM00 |
RefSeq ID | WP_010906990.1 |
PDB ID | 3LN7 |
Длина белка (а.о.) | 757 |
Молекулярная масса (Да) | 85862 |
Рекомендуемое название | Glutathione biosynthesis bifunctional protein GshAB |
У белка есть единственная модель в PDB с разрешинем 3.2 ангстрема, сделанная в 2011 году.
Поиск белка GSHAB_PASMU в UniRef
С помощью UniRef можно искать группы (кластеры) белков, последовательность которых наиболее близка к последовательности заданного белка. Можно найти с кластеры с 100, 90 и 50% похожестью. Размер кластеров для GSHAB_PASMU приведен в Tаблице 2.
UniRef100 | UniRef90 | UniRef50 | |
---|---|---|---|
ID кластера | UniRef100_Q9CM00 | UniRef90_Q9CM00 | UniRef50_Q65RX0 |
Название кластера | Glutathione biosynthesis bifunctional protein GshAB (100%) | Glutathione biosynthesis bifunctional protein GshAB (90%) | Glutathione biosynthesis bifunctional protein GshAB (50%) |
Размер кластера | 1 | 28 | 302 |
Примечательно, что и в кластере с 90% схожестью все белки принадлежат одному виду и, кроме самого исследуемого белка, остаются непроверенными, так что вполне вероятно, что и в кластер с 90% схожестью входит только сам исследуемый белок (однако возможно наличие паралогов его генов в геноме бактерии или различные варианты белка у различных подвидов - здесь нужно обращаться к вопросу, что именно можно считать одним белком).
Поиск в UniProt
В данном разделе описаны результаты различных запросов в UniProt
Поиск глутатионсинтетазы AB
- Поиск по полному рекомендованному названию
Текст запроса: "Glutathione biosynthesis bifunctional protein GshAB"
Количество находок в Swiss-Prot: 15
Общее количество находок: 1108
- Поиск по сокращенному названию
Текст запроса: "GshAB"
Количество находок в Swiss-Prot: 15
Общее количество находок: 1113
- Поиск вариантов белка, принадлежащих бактерии Pasteurella multocida
Текст запроса: "name:gshab organism:pasteurella multocida"
Количество находок в Swiss-Prot: 1
Общее количество находок: 9
- Поиск вариантов белка, принадлежащих представителям семейства Pasteurellaceae
Текст запроса: "name:gshab taxonomy:pasteurellaceae"
Количество находок в Swiss-Prot: 2
Общее количество находок: 133
- Поиск вариантов белка, принадлежащих представителям отдела Proteobacteria
Текст запроса: "name:gshab taxonomy:proteobacteria"
Количество находок в Swiss-Prot: 3
Общее количество находок: 142
Поиск лизоцимов
- Поиск лизоцимов у позвоночных
Текст запроса: "name:lysozyme taxonomy:vertebrata"
Количество находок в Swiss-Prot: 124
Общее количество находок: 1194
- Поиск лизоцимов у членистоногих
Текст запроса: "name:lysozyme taxonomy:arthropoda"
Количество находок в Swiss-Prot: 21
Общее количество находок: 893
Поиск трипсинов
- Поиск по слову "трипсин"
Текст запроса: name:trypsin
Количество находок в Swiss-Prot: 312
Общее количество находок: 22706
- Поиск трипсинов, исключая их ингибиторы
Текст запроса: name:trypsin NOT name:inhibitor
Количество находок в Swiss-Prot: 101
Общее количество находок: 18169
Таким образом, большинство результатв поиска по слову "Трипсин" имеют отношение к ингибиторам трипсинов, а не к самим трипсинам.