PSI-BLAST
Я взял белок с идентификатором P0AD49. Это был связанный с рибосомой ингибитор А, принадлежащий Escherichia coli. Он регулирует эффективность трансляции во время экспоненциальной и стационарной фаз роста бактерий. Он частично ингибирует элонгацию трансляции и тем самым уменьшат частоту ошибок трансляции во время стационарной фазы.
Таблица с результатами пси-бласта
Результаты стабилизовались окончательно только на 4 итерации, на второй итерации количество последовательностей увеличилось, на третьей уменьшилось, а четвертая, пятая и шестая оказались одинаковыми (правда немного менялся p-value одних и тех же находок).
Отличие e-value между самой плохой позицией выше порога и самой хорошей ниже порога оказалось 24-кратным. Это означает, что семейство очень даже хорошее
Эндонуклеазы рестрикции
Список сайтов был получен командой: cut -f 5 /P/y18/term4/pr8/TypeII_REs.tsv| sort -u > sites_pr7.txt
Скачать список сайтов
Контрасты рассчитаны: cbcalc -K sequence.fasta -s sites_pr7.txt -o res.tsv
Скрипт для того, чтобы выбрать подходящие эндонуклеазы (O/E ratio < 0.8, putative = no): Скачать скрипт
Результаты представлены ниже:
Sequence ID | Site | Observed | Expected (BCK) | O/E ratio (BCK) | Total | |
---|---|---|---|---|---|---|
32 | sequence | CAGCTG | 1895 | 2473.36 | 0.766 | 5593258 |
46 | sequence | CCCGGG | 818 | 1102.03 | 0.742 | 5593258 |
49 | sequence | CCGCGG | 1528 | 1935.49 | 0.789 | 5593258 |
58 | sequence | CCTAGG | 58 | 99.68 | 0.582 | 5593258 |
78 | sequence | CTAG | 1663 | 4506.38 | 0.369 | 5593260 |
81 | sequence | CTCGAG | 350 | 445.36 | 0.786 | 5593258 |
103 | sequence | GAGCTC | 297 | 479.26 | 0.620 | 5593258 |
146 | sequence | GGGCCC | 333 | 500.30 | 0.666 | 5593258 |
154 | sequence | GGWCC | 2869 | 4126.42 | 0.695 | 5593259 |
158 | sequence | GRGCYC | 1479 | 1929.51 | 0.767 | 5593258 |
Recognition site | Uniprot AC | |
---|---|---|
0 | CTCGAG | P26919 |
1 | GGGCCC | E3VXA1 |
2 | GGWCC | Q8YYB7 |
3 | GGWCC | Q72ZR4 |
4 | CTAG | E5LG97 |
5 | CTAG | E5LG98 |
6 | CTCGAG | P43421 |
7 | CTCGAG | O35025 |
8 | CTCGAG | O34885 |
9 | CTCGAG | O34303 |
10 | CTAG | Q3ARL3 |
11 | CCGCGG | B0LL99 |
12 | CCCGGG | Q60132 |
13 | CCCGGG | B3EQH0 |
14 | GGWCC | B1WZS3 |
15 | CCGCGG | Q46944 |
16 | GGWCC | P50194 |
17 | GRGCYC | Q83VS8 |
18 | GGWCC | C9RP75 |
19 | GGWCC | P25257 |
20 | GGWCC | P25259 |
21 | GGWCC | P25260 |
22 | CTAG | Q58391 |
23 | CTAG | P29566 |
24 | CCCGGG | Q9XAW7 |
25 | CTCGAG | P05104 |
26 | GGWCC | A0A2R3Q |
27 | GAGCTC | O31074 |
28 | CAGCTG | Q8KT01 |
29 | CCGCGG | Q8RLL0 |
30 | GAGCTC | B1VM78 |
31 | GGWCC | P09796 |
32 | CCCGGG | P14229 |
33 | CTCGAG | H3ZRP1 |
34 | CCCGGG | A4L311 |
35 | CCCGGG | P30773 |
©Бакулин Артемий, 2018