Назад
Я выбрал белок с идентификатором P47908 из цианобактерии Synechococcus. Он является фактором остановки трансляции за счёт димеризации рибосом в неактивные
100S частицы.
Находки psiBLAST сошлись на четвёртой итерации. Большой размер ступеньки E-value между худшей "правильной" находкой и "лучшей" неправильной говорит о большой
вероятности того, что находки составляют семейство гомологичных белков.Таблицу можно скачать здесь.
Бактерия - Kribbella flavida DSM 17836. Надо было найти в её геноме сайты рестрикции, специфичные для её рестриктаз. Эти сайты отличаются от других
последовательностей тем, что частота их встреч в геноме резко ниже ожидаемой, что нужно для предотвращения разрезания своей ДНК.
Из исходного файла, содержащего список потенциальных сайтов рестрикции, в редакторе nano был вырезан заголовок.
Затем с помощью команды cut -f 5 TypeII_REs.tsv | sort -u > sites.txt был создан список сайтов, из которого были вырезаны дубликаты. Получился файл.
Затем была оценена непредставленность сайтов в геноме, а полученные сайты расположены по убыванию непредставленности. Команды для этого:
cbcalc -s sites.txt -o burge.tsv --burge sequence.fasta
sort -k5,5g burge.tsv > sorted.tsv
Получился файл. В нём видно, что контраст меньше 0.8 у первых четырёх сайтов. Далее с помощью Excel я посмотрел, у каких рестриктаз
из исходного файла есть такие сайты, и для каких из них есть экспериментальные данные. Получившиеся в итоге три сайта и соответствующие рестриктазы:
GTTTAAAC - PmeI
AATATT - SspI
CTAG - BfaIA, BfaIB, CchI, MjaI, MthZI