Сигналы и мотивы 3
В базе данных REBASE мной была выбрана бактерия Dactylococcopsis salina PCC 8305, у которой есть система PM виорого типо. Dactylococcopsis - род Цианобактерий из семейства Chroococcaceae.
![](./Rebase.png)
Геном бактерии можно посмотреть здесь.
Для оценки представленности сайтов рестрикции была запущена команда:
cbcalc -s TypeII_REs.tsv -o out.tsv sequencePCC.fasta
Далее файл был отсортирован командой:
awk '{if ($5+0 <= 0.8) print}' out.tsv | sort | uniq > out_sorted.tsv
Получилось 93 сайта.
Далее была использована команда для поиска рестриктаз, узнающих недопредставленные в геноме Dactylococcopsis salina PCC 8305 сайты:
cut -f 5 TypeII_REs.tsv |paste - TypeII_REs.tsv |grep -E 'no'| cut -f 2-> no.txt
После этого с помощью скрипта Ренаты Бетеньковой я отфильтровал список рестриктаз на узнавание непредставленных сайтов. Вот результат работы скрипта.
PSI-BLAST
Мной был выбран идентификатор O05886. O05886 - это HPF(Hibernating Promoting Factor), белок, в результате ингибирования трансляции вызывающий формирование неактивных 70S и 100S рибосомальных мономеров и димеров в бактерии Mycobacterium tuberculosis H37Rv.
№ | Число находок выше порога (0.005) | Идентификатор худшей находки выше порога | Е-value этой находки | Идентификатор лучшей находки ниже порога | Е-value этой находки |
1 | 20 | P17161.1 | 0.003 | P17160.1 | 0.005 |
2 | 27 | P71346.3 | 1e-11 | - | - |
3 | 28 | P9WMA8.1 | 0.002 | - | - |
3 | 28 | P9WMA8.1 | 8e-20 | - | - |