PSI-BLAST

Я взял белок с идентификатором P0AD49. Это был связанный с рибосомой ингибитор А, принадлежащий Escherichia coli. Он регулирует эффективность трансляции во время экспоненциальной и стационарной фаз роста бактерий. Он частично ингибирует элонгацию трансляции и тем самым уменьшат частоту ошибок трансляции во время стационарной фазы.

Таблица с результатами пси-бласта

Результаты стабилизовались окончательно только на 4 итерации, на второй итерации количество последовательностей увеличилось, на третьей уменьшилось, а четвертая, пятая и шестая оказались одинаковыми (правда немного менялся p-value одних и тех же находок).

Отличие e-value между самой плохой позицией выше порога и самой хорошей ниже порога оказалось 24-кратным. Это означает, что семейство очень даже хорошее

Эндонуклеазы рестрикции

Список сайтов был получен командой: cut -f 5 /P/y18/term4/pr8/TypeII_REs.tsv| sort -u > sites_pr7.txt
Скачать список сайтов
Контрасты рассчитаны: cbcalc -K sequence.fasta -s sites_pr7.txt -o res.tsv
Скрипт для того, чтобы выбрать подходящие эндонуклеазы (O/E ratio < 0.8, putative = no): Скачать скрипт
Результаты представлены ниже:

Прошедшие фильтры сайты
Sequence ID Site Observed Expected (BCK) O/E ratio (BCK) Total
32 sequence CAGCTG 1895 2473.36 0.766 5593258
46 sequence CCCGGG 818 1102.03 0.742 5593258
49 sequence CCGCGG 1528 1935.49 0.789 5593258
58 sequence CCTAGG 58 99.68 0.582 5593258
78 sequence CTAG 1663 4506.38 0.369 5593260
81 sequence CTCGAG 350 445.36 0.786 5593258
103 sequence GAGCTC 297 479.26 0.620 5593258
146 sequence GGGCCC 333 500.30 0.666 5593258
154 sequence GGWCC 2869 4126.42 0.695 5593259
158 sequence GRGCYC 1479 1929.51 0.767 5593258
Выбранные эндонуклеазы
Recognition site Uniprot AC
0 CTCGAG P26919
1 GGGCCC E3VXA1
2 GGWCC Q8YYB7
3 GGWCC Q72ZR4
4 CTAG E5LG97
5 CTAG E5LG98
6 CTCGAG P43421
7 CTCGAG O35025
8 CTCGAG O34885
9 CTCGAG O34303
10 CTAG Q3ARL3
11 CCGCGG B0LL99
12 CCCGGG Q60132
13 CCCGGG B3EQH0
14 GGWCC B1WZS3
15 CCGCGG Q46944
16 GGWCC P50194
17 GRGCYC Q83VS8
18 GGWCC C9RP75
19 GGWCC P25257
20 GGWCC P25259
21 GGWCC P25260
22 CTAG Q58391
23 CTAG P29566
24 CCCGGG Q9XAW7
25 CTCGAG P05104
26 GGWCC A0A2R3Q
27 GAGCTC O31074
28 CAGCTG Q8KT01
29 CCGCGG Q8RLL0
30 GAGCTC B1VM78
31 GGWCC P09796
32 CCCGGG P14229
33 CTCGAG H3ZRP1
34 CCCGGG A4L311
35 CCCGGG P30773

Назад

©Бакулин Артемий, 2018