Назад

Я выбрал белок с идентификатором P47908 из цианобактерии Synechococcus. Он является фактором остановки трансляции за счёт димеризации рибосом в неактивные 100S частицы.

Находки psiBLAST сошлись на четвёртой итерации. Большой размер ступеньки E-value между худшей "правильной" находкой и "лучшей" неправильной говорит о большой вероятности того, что находки составляют семейство гомологичных белков.Таблицу можно скачать здесь.

Бактерия - Kribbella flavida DSM 17836. Надо было найти в её геноме сайты рестрикции, специфичные для её рестриктаз. Эти сайты отличаются от других последовательностей тем, что частота их встреч в геноме резко ниже ожидаемой, что нужно для предотвращения разрезания своей ДНК. Из исходного файла, содержащего список потенциальных сайтов рестрикции, в редакторе nano был вырезан заголовок. Затем с помощью команды cut -f 5 TypeII_REs.tsv | sort -u > sites.txt был создан список сайтов, из которого были вырезаны дубликаты. Получился файл. Затем была оценена непредставленность сайтов в геноме, а полученные сайты расположены по убыванию непредставленности. Команды для этого:
cbcalc -s sites.txt -o burge.tsv --burge sequence.fasta
sort -k5,5g burge.tsv > sorted.tsv
Получился файл. В нём видно, что контраст меньше 0.8 у первых четырёх сайтов. Далее с помощью Excel я посмотрел, у каких рестриктаз из исходного файла есть такие сайты, и для каких из них есть экспериментальные данные. Получившиеся в итоге три сайта и соответствующие рестриктазы:
GTTTAAAC - PmeI
AATATT - SspI
CTAG - BfaIA, BfaIB, CchI, MjaI, MthZI