Выбор белка проходил с помощью расширенного поиска на UniProt, в фильтрах в поле Taxonomy [OC] было указано название штамма моей бактерии Thiomicrorhabdus aquaedulcis. Поиск не дал результатов, поэтому я в том же поле указал род Thiomicrorhabdus (после начала поиска он поменялся на таксономический идентификатор taxonomy_id:2039723), полученные результаты отсортировал по убыванию уровня аннотации (Annotation score), в верхних строках были белки с показателями 4/5 и 5/5. В общей сложности получено 4392 результата, из которых 1 имеет значение Annotation score 5/5, а 33 имеют 4/5. Среди результатов не было рецензированных.
Выбранный организм:
Царство | Bacteria |
---|---|
Тип | Pseudomonadota |
Класс | Gammaproteobacteria |
Порядок | Thiotrichales |
Семейство | Piscirickettsiaceae |
Род | Thiomicrorhabdus |
Вид | Thiomicrorhabdus sediminis |
Таксономический идентификатор: 2580412
Выбранный белок: Сиротем-синтаза
Название | Siroheme synthase |
---|---|
Ген | cobA |
Статус | Не рецензирован |
Длина (АК) | 488 |
Выбранный белок: Сиротем-синтаза (Siroheme synthase). ID белка: A0A4P9K5Y7_9GAMM.
Копия файла с информацией о белке, оригинал присутствует в папке ~/term2/pr7/protein_info.txt
Копия файла с кластерами похожих белков, оригинал присутствует в папке ~/term2/pr7/protein_clusters.txt
Я решил поискать рецензированные записей о белках бактерий рода Thiomicrorhabdus.
Запрос
(reviewed:true) AND (taxonomy_id:2039723)
не дал результатов. Однако поиск
среди бактерий семества Piscirickettsiaceae с помощью запроса
(reviewed:true) AND (taxonomy_id:135616)
дал 374 результата.
Затем мне стало
интересно найти мой белок среди рецензированных белков бактерий этого семейтсва, и с помощью
запроса
(reviewed:true) AND (taxonomy_id:135616) AND (protein_name:"Siroheme synthase")
получил 1 результат (имя белка: CYSG_HYDCU, к тому же, этот белок присутствует
в кластере похожих на мой белок UniRef50_Q31GG8)
Я решил провести поиск по разным значениям параметра Protein existence (PE) среди белков
бактерий семейства Thiomicrorhabdus. Запросы имели вид
(taxonomy_id:2039723) AND (existence:N)
где вместо N вводилось значение PE (от 1 до 5). Результаты приведены в таблице:
PE | Пояснение к PE | Число результатов |
---|---|---|
1 | Experimental – белок выделен и изучен | 0 |
2 | Transcript level – есть доказательства на уровне РНК, но белок не охарактеризован | 6 |
3 | Inferred from homology – предсказан по сходству с уже известными белками | 2349 |
4 | Predicted – информация получена исключительно компьютерными методами | 2037 |
5 | Uncertain – существование сомнительно | 0 |
Проведен поиск трансмембранных белков бактерий семейства Thiomicrorhabdus. Поисковой запрос
представлял из себя
(taxonomy_id:2039723) AND (keyword:KW-0812)
Было получено 1007 результатов