Выбрана бактерия Laribacter hongkongensis LHGZ1. Полный геном был скачан из БД NCBI Assembly (PRJNA389628).
res.txt - файл с полным списком всех рестриктаз (со страницы задания практикума)
В разделе summary базы данных REBASE для выбранной бактерии характеристики систем рестрикции-модификации, в том числе эндонуклеазы и их специфические сайты.
Рестриктазы II-типа и сайты рестрикции, подвержденные REBASE:
GATC (M.LhoZ1ORF1952P)
CCWGG (V.LhoZ1ORF3482P, M.LhoZ1ORF3482P)
Далее были получены последовательности сайтов и список эндонуклеаз, их узнающий (из файла res.txt)
good_sites.txt - файл с последовательностями недопредставленных сайтов
nucleases.txt - файл с эндонуклеазами, узнающими недопредставленные сайты
df = pd.read_csv('./pr8/psi_blast..txt', sep=',')
df
Номер итерации | Число находок выше порога (0,005) | Идентификатор худшей находки выше порога | E-value этой находки | Идентификатор лучшей находки ниже порога | E-value этой находки.1 | |
---|---|---|---|---|---|---|
0 | 1 | 18 | Q9FFU1.1 | 0.005 | Q9SL79.2 | 0.007 |
1 | 2 | 20 | Q9LDA9.1 | 9,00E-29 | - | - |
2 | 3 | 21 | P54454.1 | 2,00E-06 | - | - |
3 | 4 | 21 | P54454.1 | 2,00E-21 | - | - |
4 | 5 | 21 | P54454.1 | 2,00E-21 | - | - |