База данных UniProt

РНК-метилтрансферазы — группа ферментов, катализирующих метилирование нуклеотидных остатков в составе РНК. Данный белок, в частности, метилирует уридин в положении 2552 23S рРНК в положении 2'-O рибозы в полностью собранной 50S рибосомной субъединице.

Получение информации о белке RLME_THEVO.

Вся информация. представленная в таблице 1 была получена из базы данных UniProt с помощью поиска по идентификатору. Были получены данные о длине белка, его молекулярной массе и числе PDB-структур.

Таблица 1. Основная информация о белке RLME_THEVO из UniProt.
UniProt ID UniProt AC RefSeq ID PDB ID Длина белка (а.о.) Молекулярная масса (Да) Рекомендуемое название
Q97C13 RLME_THEVO WP_010916547.1 BAB59434.1 197 22,604 Ribosomal RNA large subunit methyltransferase E

Самое высокое разрешение рентгеноструктурного анализа: 1.45Å. Белок внесен в базу в 2005 году.

Поиск белка RLME_THEVO в UniRef.

Таблица 2. Кластеры UniRef, содержащие белок .
Раздел UniRef ID кластера Название кластера Размер кластера
UniRef100 UniRef100_Q97C13 Ribosomal RNA large subunit methyltransferase E 1
UniRef90 UniRef90_Q97C13 Ribosomal RNA large subunit methyltransferase E 2
UniRef50 UniRef50_Q97C13 Ribosomal RNA large subunit methyltransferase E 4

Был проведен поиск в базе данных UniRef по идентификатору белка, чтобы получить информацию о распространенности белка. Если есть много белков внутри кластеров 100% и 90% - можно сделать вывод о важности белка=> на аминокислотную последовательность действует стабилизирующий отбор..

Сеансы поиска в Uniprot.

Для знакомства с синтаксисом запросов в UniProt были проведены сеансы поиска, представленные ниже. >

Поиск рибосомальной РНК большой субъединицы Е-метилтрансферазы

  1. Поиск по рекомендованному названию белка

    Текст запроса: name:"Ribosomal RNA large subunit methyltransferase E"
    Количество находок в Swiss-Prot: 3785
    Общее количество находок: 94206

  2. Поиск по тому же названию среди белков своего организма

    Текст запроса: name:"Ribosomal RNA large subunit methyltransferase E" organism:"Thermoplasma volcanium"
    Количество находок в Swiss-Prot: 1
    Общее количество находок: 1

  3. Поиск по тому же названию среди белков из организмов того же семейства

    Текст запроса: "ribosomal rna large subunit methyltransferase e" taxonomy:"Thermoplasmataceae [46659]"
    Общее количество находок: 3

  4. Поиск по тому же названию среди белков из организмов того же отряда

    Текст запроса: "ribosomal rna large subunit methyltransferase e" taxonomy:"Thermoplasmatales [2301]"
    Количество находок в Swiss-Prot: 3
    Общее количество находок: 25

Поиск цитохромов

  1. Просто поиск цитохромов

    Текст запроса: cytochrome
    Количество находок в Swiss-Prot: 10,827
    Общее количество находок: 2,950,830

  2. Поиск цитохромов среди белков позвоночных

    Текст запроса: cytochrome taxonomy:vertebrata
    Количество находок в Swiss-Prot: 3,638
    Общее количество находок: 328,604

  3. Поиск цитохромов среди белков инфузорий

    Текст запроса: cytochrome taxonomy:ciliophora
    Количество находок в Swiss-Prot: 11
    Общее количество находок: 2,127

Поиск трипсинов

  1. Поиск по слову "трипсин"

    Текст запроса: name:trypsin
    Количество находок в Swiss-Prot: 312
    Общее количество находок: 22,706

  2. Поиск трипсинов, исключая их ингибиторы

    Текст запроса: name:trypsin NOT name:inhibitor
    Количество находок в Swiss-Prot: 101
    Общее количество находок: 18,169

Uniprot дает возможность просматривать историю изменений записей о белке. Во вкладке History имеются все версии записей белка. Также возможно весьма удобно сравнивать разные версии записей. На момент изучения HPr kinase/phosphorylase на Uniprot последней актуальной версией является версия под номером 121. По сравнению с первой версией произошло большое количество изменений. К примеру, ID поменялся с P75548 на HPRK_MYCPN. В строке OS поменялось видовое название (был добавлен штамм бактерии), в строках OC претерпела изменения таксономия. Были добавлены строки DE, в которых указываются рекомендуемые и альтернативные названия. Также была добавлена информация по характеристикам участков последовательностей в строках FT и общая информация о функции, биологический процессах и тд в строки CC. Сравнение данных в базах Uniprot и RefSeq Были сопоставлены записи о белке в Uniprot и RefSeq Protein [2]. В общем и целом, принципиальные различия не были обнаружены, однако визуально информация в RefSeq кажется более структурированной и, как следствие, более понятной. Также дата обновления данных в RefSeq страрше на почти на 2 года (на момент выполнения задания дата в Uniprot – 28 февраля 2018 года; RefSeq – 28 августа 2016 года). Недостатком RefSeq является отсутствие идентификаторов других баз данных, что ограничивает возможность получения дополнительной информации о белке.