Выбор белка бактерии Neptuniibacter halophilus для исследования.
Neptuniibacter halophilus [651666]
Поскольку моя бактерия найдена относительно недавно и интересна примерно мне (и никому больше), в базе UniProt нашлось всего 2 белка: recA и rpoB. И те "Inferred from homology".
Недолго думая, я выбрал белок recA, поскольку он не настолько банален и даст возможность рассмотреть не только полимеризацию РНК.
Neptuniibacter [459520]
Я решил посмотреть, насколько отсеквенированы белки самого рода Neptuniibacter. При помощи средств bash и Python я получил следующую таблицу:
| Род | Количество белков, шт. | Neptuniibacter caesariensis | 5037 | Neptuniibacter pectenicola | 3296 | Neptuniibacter sp. CAR-SF | 16 | Neptuniibacter marinus | 3 | Neptuniibacter halophilus | 2 | uncultured Neptuniibacter sp | 1 | Neptuniibacter sp. Phe_28 | 1 |
|---|
На удивление, моя бактерия оказалась одной из наименее изученных в таксоне. Если учесть, что Neptuniibacter sp. появляется в таблице несколько раз, то просто наименее изученной.
recA
Neptuniibacter [459520]
Я решил проверить, есть ли такие же белки как мой в таксоне. И нашёл ещё 2 у Neptuniibacter caesariensis и 1 у Neptuniibacter pectenicola.
Забавно, что когда recA у Neptuniibacter halophilus имеет длину 272 AA, у других видов эта длина составляет 345-346 AA. Возможно, у моей бактерии произошла некая делеция. С этим знанием я могу, например, сравнить аннотации или попробовать что-то построить.Таким образом, мой белок recA на удивление мало распространён.
(gene:recA) AND (taxonomy_id:2157)
Смотрим мой же белок, но у Архей. В результате выдачи 36 белков, но все они аннотированы как "DNA repair and recombination protein RadA"
transposase AND (taxonomy_id:459520) NOT (organism_id:207954)
Можем ещё посмотреть транспозазы у Neptuniibacter, но не caesariensis, потому что он наиболее описан и там они будут с наибольшей вероятностью.
Удивления не произошло, в результатах только Neptuniibacter pectenicola.
(uniref_cluster_50:UniRef50_K4EIA1) NOT (taxonomy_id:2)
По этому запросу мы находим целых два белка из метагеномов, морского и пресноводного. Видимо, это всё ещё бактерии, но в составе метагенома.