Практикум 7. Uniprot

Бактерия, в которой ищутся белки: Arcobacter cloacae

Запрос для отбора: (taxonomy_id:1054034). - Поиск всех белков Arcobacter cloacae

Получено 4880 результатов.

Выбран белок с ID: A0A4Q0V9H8_9PROT
AC: A0A4Q0V9H8
Название белка: Pyrimidine/purine nucleoside phosphorylase

Причина выбора: Оценка аннотации 4/5. 2 публикации, в то время как у большинства есть только одна.

Описание белка:

Перевод названия: Пиримидин-пуриновая-нуклеозидфосфорилаза

В качестве субстрата может использовать: уридин, аденозин, гуанозин, цитидин, тимидин, инозин и ксантозин.

Может катализировать обратную реакцию.

История запросов:

1. Поиск белка (UniProtKB)

(taxonomy_id:1054034) - поиск белков Arcobacter cloacae

найдено 4880 объектов.

2. Работа с UniRef, поиск кластеров, содержащих рассматриваемый белок

(uniprot_id:A0A4Q0V9H8)

Найдено 3 кластера (100%, 90%, 50%).

3. Эксперимент с опциями поисковой строки (UniProtKB)

(reviewed:true) AND (taxonomy_id:9606) - поиск белков Homo sapiens в Swiss-Prot

20423 результата.

(reviewed:false) AND (taxonomy_id:9606) - поиск белков Homo sapiens в TrEMBL. 186715 результатов.

Вывод: Просмотренных человеком белков гораздо меньше (белков в курируемой базе Swiss-Prot), чем белков в автоматических базах. (Что было очевидно)

4. Эксперимент с опциями поисковой строки (UniRef)

(cluster:UniRef50_A0A1B0GTW7) AND (identity:0.9)

Результат: список 90% кластеров, связанных с UniRef50_A0A1B0GTW7

5. Эксперимент с опциями поисковой строки (UniRef)

(taxonomy_id:1054034) NOT (uniprot_id:A0A4Q0V9H8) AND (identity:1.0) - все 100% кластеры белков Arcobacter cloacae, кроме тех, которые содержат белок с AC: A0A4Q0V9H8

найдено 4985 кластеров. Вывод: С помощью разных логических операторов можно сужать круг поиска.

6. Эксперимент с опциями поисковой строки (UniRef)

(taxonomy_id:1054034) AND (uniprot_id:A0A4Q0V9H8) AND (identity:1.0) - поиск всех 100% кластеров, теперь кластер с белком AC: A0A4Q0V9H8 включён в перечень

Найдено 4986 кластеров.