Недопредставленность сайтов рестрикции в геноме бактерии

Для анализа была выбрана бактерия Thalassobius gelatinovorus NEB572, геном которой содержит гены эндонуклеазы рестриции системы Р-М типа II. Последовательность генома бактерии была скачана из базы данных NCBI Genome (ссылка на файл).

https://kodomo.fbb.msu.ru/~mdavitadze/term4/documents/result.csv

Из таблицы с сайтами рестрикции были отобраны сайты длиной больше двух нуклеотидов. Представленность данных сайтов в геноме была оценена с помощью программы CBcalc следующей командой:

cbcalc sequence-2.fasta -s sites.txt -o sites.tsv -K

Ссылка на файл с отобранными сайтами.

Ссылка на результат работы программы.

Далее из таблицы с результатом работы CBcalc были отобраны наиболее недопредставленные сайты, то есть сайты со значением контраста меньше 0,8. С ними можно ознакомиться по ссылке. Также был получен список проверенных экспериментально эндонуклеаз рестрикции, узнающих недопредставленные сайты.

Из проведенного анализа следует, что в геноме бактерии Thalassobius gelatinovorus NEB572 25 недопредставленных сайта, 21 из которых узнается 78 различными проверенными экспериментально эндонуклеазами.

PSI-BLAST

Для анализа был выбран белок с идентификатором (AC) P17265. Это Ribosome hibernation promotion factor из организма Rhizobium meliloti.

Число находок выше порога (0,005)Идентификатор худшей находки выше порогаE-value этой находкиИдентификатор лучшей находки ниже порогаE-value этой находки
7Q5XAQ7.16e-40P28368.20.012
26P71346.32e-04--
28P9WMA8.10.001--

Результат быстро сошелся: после третьей итерации список находок выше порога перестал меняться. P17265, Q5XAQ7.1, P28368.2 и P71346.3 подавляют работу рибосом, вместе с P9WMA8.1 они являются ингибиторами трансляции. Таким образом, находки по всей видимости гомологичны и обладают высоким сродством.