Практикум 7

Выбор белка бактерии Neptuniibacter halophilus для исследования.

1. Выбор белка

  1. Ищем все белки

    • Taxonomy [OC]:
      Neptuniibacter halophilus [651666]

    Поскольку моя бактерия найдена относительно недавно и интересна примерно мне (и никому больше), в базе UniProt нашлось всего 2 белка: recA и rpoB. И те "Inferred from homology".

  2. Недолго думая, я выбрал белок recA, поскольку он не настолько банален и даст возможность рассмотреть не только полимеризацию РНК.

  3. Смотрим, как много белков есть для рода

    • Taxonomy [OC]:
      Neptuniibacter [459520]

    Я решил посмотреть, насколько отсеквенированы белки самого рода Neptuniibacter. При помощи средств bash и Python я получил следующую таблицу:

  4. Таб. 1. Частота встречаемости белков видов рода Neptuniibacter в результатах по запросу 2.
    Род Количество белков, шт.
    Neptuniibacter caesariensis 5037
    Neptuniibacter pectenicola 3296
    Neptuniibacter sp. CAR-SF 16
    Neptuniibacter marinus 3
    Neptuniibacter halophilus 2
    uncultured Neptuniibacter sp 1
    Neptuniibacter sp. Phe_28 1

    На удивление, моя бактерия оказалась одной из наименее изученных в таксоне. Если учесть, что Neptuniibacter sp. появляется в таблице несколько раз, то просто наименее изученной.

  5. Смотрим схожие белки у других бактерий рода

    • Gene Name [GN]:
      recA
    • Taxonomy [OC]:
      Neptuniibacter [459520]
  6. Я решил проверить, есть ли такие же белки как мой в таксоне. И нашёл ещё 2 у Neptuniibacter caesariensis и 1 у Neptuniibacter pectenicola.

    Забавно, что когда recA у Neptuniibacter halophilus имеет длину 272 AA, у других видов эта длина составляет 345-346 AA. Возможно, у моей бактерии произошла некая делеция. С этим знанием я могу, например, сравнить аннотации или попробовать что-то построить.

2. Информация о белке

3. Кластеры похожих белков

4. Поисковые запросы

  1. recA у архей

    (gene:recA) AND (taxonomy_id:2157)

    Смотрим мой же белок, но у Архей. В результате выдачи 36 белков, но все они аннотированы как "DNA repair and recombination protein RadA"

  2. Транспозазы

    transposase AND (taxonomy_id:459520) NOT (organism_id:207954)

    Можем ещё посмотреть транспозазы у Neptuniibacter, но не caesariensis, потому что он наиболее описан и там они будут с наибольшей вероятностью.

    Удивления не произошло, в результатах только Neptuniibacter pectenicola.

  3. Кластер UniRef50 для транспозазы, но не для бактерий

    (uniref_cluster_50:UniRef50_K4EIA1) NOT (taxonomy_id:2)

    По этому запросу мы находим целых два белка из метагеномов, морского и пресноводного. Видимо, это всё ещё бактерии, но в составе метагенома.