Практикум 7. UniProt

1. Выбор белка

Выбор белка проходил с помощью расширенного поиска на UniProt, в фильтрах в поле Taxonomy [OC] было указано название штамма моей бактерии Thiomicrorhabdus aquaedulcis. Поиск не дал результатов, поэтому я в том же поле указал род Thiomicrorhabdus (после начала поиска он поменялся на таксономический идентификатор taxonomy_id:2039723), полученные результаты отсортировал по убыванию уровня аннотации (Annotation score), в верхних строках были белки с показателями 4/5 и 5/5. В общей сложности получено 4392 результата, из которых 1 имеет значение Annotation score 5/5, а 33 имеют 4/5. Среди результатов не было рецензированных.

Выбранный организм:

ЦарствоBacteria
ТипPseudomonadota
КлассGammaproteobacteria
ПорядокThiotrichales
СемействоPiscirickettsiaceae
РодThiomicrorhabdus
ВидThiomicrorhabdus sediminis

Таксономический идентификатор: 2580412

Выбранный белок: Сиротем-синтаза

НазваниеSiroheme synthase
ГенcobA
СтатусНе рецензирован
Длина (АК)488

Выбранный белок: Сиротем-синтаза (Siroheme synthase). ID белка: A0A4P9K5Y7_9GAMM.

2. Информация о белке

Копия файла с информацией о белке, оригинал присутствует в папке ~/term2/pr7/protein_info.txt

3. Кластеры похожих белков

Копия файла с кластерами похожих белков, оригинал присутствует в папке ~/term2/pr7/protein_clusters.txt

4. Поисковые запросы

  1. Поиск рецензированных записей
  2. Я решил поискать рецензированные записей о белках бактерий рода Thiomicrorhabdus. Запрос
    (reviewed:true) AND (taxonomy_id:2039723)
    не дал результатов. Однако поиск среди бактерий семества Piscirickettsiaceae с помощью запроса
    (reviewed:true) AND (taxonomy_id:135616)
    дал 374 результата.

    Затем мне стало интересно найти мой белок среди рецензированных белков бактерий этого семейтсва, и с помощью запроса
    (reviewed:true) AND (taxonomy_id:135616) AND (protein_name:"Siroheme synthase")
    получил 1 результат (имя белка: CYSG_HYDCU, к тому же, этот белок присутствует в кластере похожих на мой белок UniRef50_Q31GG8)

  3. Поиск по уровню доказательств существования белка (Protein existence)
  4. Я решил провести поиск по разным значениям параметра Protein existence (PE) среди белков бактерий семейства Thiomicrorhabdus. Запросы имели вид
    (taxonomy_id:2039723) AND (existence:N)
    где вместо N вводилось значение PE (от 1 до 5). Результаты приведены в таблице:

    PEПояснение к PEЧисло результатов
    1Experimental – белок выделен и изучен0
    2Transcript level – есть доказательства на уровне РНК, но белок не охарактеризован6
    3Inferred from homology – предсказан по сходству с уже известными белками2349
    4Predicted – информация получена исключительно компьютерными методами2037
    5Uncertain – существование сомнительно0
  5. Поиск по ключевым словам на примере трансмембранных белков
  6. Проведен поиск трансмембранных белков бактерий семейства Thiomicrorhabdus. Поисковой запрос представлял из себя
    (taxonomy_id:2039723) AND (keyword:KW-0812)
    Было получено 1007 результатов