Практикум 7: UniProt

1. Выбор белка

Рассматриваемая мной бактерия в мини-обзоре - Mycolicibacterium madagascariense - имеет 5673 записи белковых последовательностей (поиск проводился по запросу (taxonomy_id:212765)). Далее для выбора более вероятно существующеей последовательности был проведен поиск по запросам: (taxonomy_id:212765) AND (existence:1) - 0 последовательностей, (taxonomy_id:212765) AND (existence:2) - 3 последовательности.

Хочется подметить, что все последовательности для этой бактерии содержаться только в базе данных TrEMBL, то есть являются непросмотренными, так как это база содержит только автоматически аннотированные белковые последовательности.

Из-за низкой степени аннотированности белков у бактерии Mycolicibacterium madagascariense, я решил рассмотреть последовательности белков для рода Mycolicibacterium ((taxonomy_id:1866885)and(existence:1)). Выбор пал на белок большой рибосомной субъединицы bL27, так как он небольшой (88 ak) и есть в базе Swiss-Prot.

Ссылка на белок

2. Информация о белке

Из файла UniProt была взята информация о белке. Например, такая как его название - Белок большой рибосомной субъединицы bL27. Скачивание файла проводилось со страницы белка и просмотренно вручную.

3. Кластеры похожих белков

Со страницы белка перешёл по ссылкам на страницы UniRef100_A0R150, UniRef90_A4T2J3, UniRef90_A4T2J3(со страницы рассматриваемой белковой последовательности в разделе Similar Proteins 100%, 90% и 50% нажав на гиппер-ссылку кластера). У белков с 100 и 90 процентами идентичности длина последовательностей совпадает, а у 50% схожести - нет, но их длины всё равно не выходят за пределы 200 аминокислот.

4. Поисковые запросы

В аннотации белка указано три термина GO, одним из которых является структурный компонент рибосомы (GO:0003735). Изначально выбор белка проводился роду, а чтобы узнать о белках моей бактерии, которые являются структурными компонентами рибосомы, поиск был проведен по запросу: (taxonomy_id:212765) AND (go:0003735). Было найдено 58 записей, включающих различные белки малой и большой субъеденицы, а также один РНК-связывающий, белок 50S и 30S рибосомальные белки.

Благодаря запросу (protein_name:"Large ribosomal subunit protein") AND (taxonomy_id:9606) AND (reviewed:true) получилось узнать, что у человека компонентами большой субъеденицы рибосомы являются 107 белков, аннотированных вручную.

Чтобы узнать, является ли белок bL27 единственным продуктом гена rpmA, был введен запрос: (gene:rpmA) AND (taxonomy_id:212765). Выдача содержала одну запись, что подтверждает, что с данного гена экспрессируется только один белок.