Создание выборки белков с одинаковыми функциями.


Задача – создать выборку белков, выполняющих ту же функцию, что и глицеропорин (GlpF) из Escherichia coli, штамм К-12.

Часть 1. Краткое описание прототипа по данным банка аминокислотных последовательностей Swiss-Prot, release…..

Метка поля (line code) Запись
Внутренний уникальный
постоянный идентификатор документа
АС P11244
Имя документа/белка ID GLPF_ECOLI
Название белка, отражающее его функции DE Глицеропорин
Дата создания документа DT 01-июля-1989
Дата последнего исправления
аннотации
DT 15-марта-2004
Название организма OS Escherichia coli
Название таксона OC Bacteria; Proteobacteria;
Gammaproteobacteria; Enterobacteriale;
Enterobacteriaceae; Escherichia
Длина последовательности SQ 281
Молекулярная масса белка SQ 29780 а.е.м.
Число публикаций,
использованных при создании документа
RL 14
Название журнала с самой свжей публикацией RL Science (2002)
Описание вторичной структуры FT В описании указаны виды подобных структур
(наличие альфа-спиралей) и их местоположение
(с какой по какую амнокислоту)
Что содержит поле комментариев CC Описание функций белка, строения кофактора,
наличие субъединиц, доменов, локализация, название семейства и др.
Какие особенности последовательности указаны? FT Особенности строения доменов, трансмембранные участки,
функциональные особенности разных участков (например, узнавание субстрата)
, места связывания с металлами, участки
с различными аминокислотами в разных штаммах, участки со вторичной структурой,
места в публикациях, содержащие противоречивую информацию о последовательности.
Идентификатор файла PDB RX 1FX8, 1LDA, 1LDF, 1LDI

Результаты поиска в БД UniProt белков с тем же кратким описанием (DE), что и P11244.

Запрос Археи
(Archae)
Бактерии
(Bacteria)
Эукариоты
(Eukaryota)
(Bacteria)
Glycerol uptake facilitator protein 0 57 1
GLPF 0 16 1
Glycerol facilitator 0 81 2

Часть 2. Описание процедуры составления выборки

Описание составления выборки:

  • 1. Поисковая система: SRS (Sequence Retreival System).
  • 2. Веб-сервер: http://srs.ebi.ac.uk/
  • 3. Сначала поиск производился по банку данных Swiss-Prot в связи с банком данных PDB. Исходный белок был найден по Accession number. Для организмов поиск проводился по банку данных UniProt по описанию функций белка (Description) и названиям организмов. В данном случае это транспортный белок для глицерола, организмы: E. coli, Y. pestis, P. multocida. Результатом поиска были различные белки с той же функцией в указанных организмах. В зависимости от запроса получались различные результаты:

    Запрос Количество найденных документов
    Glycerol facilitator protein 2
    GLPF 4
    Glycerol facilitator 3
    Glycerol uptake facilitator 3

    Часть 3. Описание выборки

    Отбор проводился со следующими критериями:

  • 1. Белок должен иметь то же описание функции, что и исходный.
  • 2. Белок должен отличаться от исходного по строению (аминокислотной последовательности) и находиться в другом (возможно, родственном) организме.
  • Результат выборки следующий:

    ID AC Организм Таксон
    Q8ZJK5 Q8ZJK5 Yersenia pestis Bacteria;
    Proteobacteria
    Gammaproteobacteria
    Enterobacteriales
    Enterobacteriaceae
    Yersenia
    Q9CLO3 Q9CLO3 Pasteurella multocida Bacteria
    Proteobacteria
    Gammaproteobacteria
    Pasteurellales
    Pasteurellaceae
    Pasteurella

    Расширенная выборка белков с теми же свойствами, но в других группах организмов:

    ID AC Организм Таксон
    GLPF_BASCU P18156 Bacilllus subtilis Bacteria
    Firmicutes
    Bacillales
    Bacillaceae
    Bacillus
    GLPF_MYCGA P52280 Mycoplasma gallisepticus Bacteria
    Firmicutes
    Mollicutes
    Mycoplasmataceae
    Mycoplasma
    GLPF_STRPN P52281 Streptococcus pneumoniae Bacteria
    Firmicutes
    Lactobacillales
    Streptococcaceae
    Streptococcus
    GLPF_BUCAI P57392 Buchnera aphidicola Bacteria
    Proteobacteria
    Gammaproteobacteria
    Enterobacteriales
    Enterobacteriaceae
    Buchnera
    GLPF_GAEIN P44826 Haemophillus influenzae Bacteria
    Proteobacteria
    Gammaproteobacteria
    Pasteurellales
    Pasteurellaceae
    Haemophillus
    GLPF_SHIFL P31140 Shigella flexneri Bacteria
    Proteobacteria
    Gammaproteobacteria
    Enterobacteriales
    Enterobacteriaceae
    Shigella

    Главная страница