Сигналы и мотивы 3

В базе данных REBASE мной была выбрана бактерия Dactylococcopsis salina PCC 8305, у которой есть система PM виорого типо. Dactylococcopsis - род Цианобактерий из семейства Chroococcaceae.

Геном бактерии можно посмотреть здесь.

Для оценки представленности сайтов рестрикции была запущена команда:

cbcalc -s TypeII_REs.tsv -o out.tsv sequencePCC.fasta

Далее файл был отсортирован командой:

awk '{if ($5+0 <= 0.8) print}' out.tsv | sort | uniq > out_sorted.tsv

Получилось 93 сайта.

Далее была использована команда для поиска рестриктаз, узнающих недопредставленные в геноме Dactylococcopsis salina PCC 8305 сайты:

cut -f 5 TypeII_REs.tsv |paste - TypeII_REs.tsv |grep -E 'no'| cut -f 2-> no.txt

После этого с помощью скрипта Ренаты Бетеньковой я отфильтровал список рестриктаз на узнавание непредставленных сайтов. Вот результат работы скрипта.

PSI-BLAST

Мной был выбран идентификатор O05886. O05886 - это HPF(Hibernating Promoting Factor), белок, в результате ингибирования трансляции вызывающий формирование неактивных 70S и 100S рибосомальных мономеров и димеров в бактерии Mycobacterium tuberculosis H37Rv.

Число находок выше порога (0.005)Идентификатор худшей находки выше порогаЕ-value этой находкиИдентификатор лучшей находки ниже порогаЕ-value этой находки
120P17161.10.003P17160.10.005
227P71346.31e-11--
328P9WMA8.10.002--
328P9WMA8.18e-20--