Второй семестр

Uniprot. Поиск по аннотации

Все белки - компоненты АТФ-синтазы, закодированные в геноме бактерии Amycolatopsis mediterranei (strain U-32)

В Uniprot было подано несколько запросов, для того, чтобы протестировать, как работает поиск. Запросы и результаты представлены в таблице ниже:

Строка запроса Число записей Комментарий
organism:"amycolatopsis mediterranei" 18903 Очень обширный запрос: выданы все белки всех штаммов бактерии Amycolatopsis mediterranei
organism:"amycolatopsis mediterranei strain u 32" 9205 В результате были выданы все белки из штамма U-32 бактерии Amycolatopsis mediterranei
organism:"amycolatopsis mediterranei strain u 32" gene:atp* 9 Success!

Ссылка на последний результат и скриншот результата последнего запроса:

Таким образом, удалось найти 9 компонент АТФ-синтазы нашей бактерии, все 9 белков в TrEMBL. По доказательству существования все найденные белки выявлены из соображений гомологии, что говорит нам о том, что эксперты еще не добрались до этих белков и не проверили правильность информации о них. Если говорить о ко-локализации, то 8 из 9 геннов ко-локализованы, а один (atpE) находится в другом участке хромосомы. Еще файл с выравниванием

Все белки - компоненты АТФ-синтазы, закодированные в геноме бактерии Amycolatopsis orientalis HCCB10007

Проведем аналогичный поиск для генома бактерии того же рода Amycolatopsis orientalis HCCB10007.

    Последний запрос:
  1. organism:"amycolatopsis orientalis" gene:atp*

Удалось найти восемь компонент АТФ-синтазы, все они из TrEMBL, все относятся к выявленным из соображений гомологии. В отличии от первого поиска, гены, кодирующие белки из этой бактрии ко-локализованы. Файл с последовательностями.

Поиск гомолога одной из субъединиц в других геномах

Найдем гомологов субъединицы альфа АТФ-синтазы бактерии Amycolatopsis orientalis HCCB10007. Для этого использовалась программа BLAST, были выбраны только белки из Swiss-Prot, но ни для одного из них не известна структура. Ниже представлен результат выдачи и файл с последовательностями в fasta-формате.

Поиск белков - компонентов АТФ-синтазы, закодированных в геноме нашей бактерии, на сайте NCBI

Задание аналогично первому: попытаться найти все компоненты АТФ-синтазы бактерии

Задание аналогично первому: попытаться найти все компоненты АТФ-синтазы бактерии Amycolatopsis mediterranei (strain U-32) в базе данных NCBI. Запросы в NCBI для поиска белков-компонентов:

Строка запроса Число записей Комментарий
(Amycolatopsis mediterranei U32[Organism]) AND atp*[Gene/Protein Name] 282 * в NCBI означает абсолютно любое продолжение, потому в результаты попали такие вещи, как ATP-binging, ATP-dependent, ATPase/permease
(Amycolatopsis mediterranei U32[Organism]) AND ATPsynthase Поиск не дал результатов, поэтому NCBI разделил ATP и synthase и выдал 28 результатов Здесь поиск пошел по словам ATP и synthase раздельно, поэтому в выдачу попали не те результаты
(Amycolatopsis mediterranei U32[Organism]) AND "ATP synthase" 11 9 из них действительно являются белками-компонентами АТФ-синтазы, 2 других - hypothetical proteins (предполагаемые белки).

Протеом бактерии Amycolatopsis mediterranei U-32

Протеом - совокупность всех белков, закодированных в геноме. Для анализа протеома моей бактерии в Uniprot в поле поиска ввела organism:"amycolatopsis mediterranei strain u 32", получила выдачу в 9205 белков. Из низ Reviewed (Swiss-Prot) - 3, все inferred from homology; unreviewed (TrEMBL) - 9202. Из них:

  1. Evidence at protein level - 0
  2. Evidence at transcript level - 2
  3. Inferred from homology - 1565
  4. Predicted - 7635
  5. Uncertain - 0

По полученным результатам сразу можно сказать, что бактерия мало уизучена на молекулярном уровне.

Посмотрим, есть ли белки в протеоме нашей бактерии, которые сходны на 90% и 50% с другими белками, и сколько их. Результат:

  1. Схожих на 90%: найдено 9172 белка, которые попали в кластеры по схожести
  2. Схожих на 50%: 8803 кластера