Рестрикция-модификация - механизм, благодаря которому клетка уничтожает чужеродную ДНК. Он осуществляется одним либо несколькими ферментами, которые обладают нуклеазной (разрезают неметилированную ДНК) и метилтрансферазной (метилируют собственную ДНК) активностями. Для предотвращения повреждения собственной ДНК в геноме сайты рестрикци встречаются редко.
Для анализа выбрала Arachidicoccus species BS20. Поиск недопредставленных сайтов рестрикции в геноме осуществляла при помощи скрипта:
#!/usr/bin/env python3 import subprocess import pandas subprocess.run('cbcalc -s TypeII_REs.tsv -o out.tsv sequence.fasta', shell=True) #поиск сайтов рестрикции restrict = pandas.read_csv('TypeII_REs.tsv', sep='\t') table = pandas.read_csv('out.tsv', sep='\t') table = table.loc[table['Site'].str.len() > 2].drop_duplicates(keep='first') #фильтрую по длине сайта и удаляю дупликаты table = table.loc[table['O/E ratio (MM)']<0.8] #отсекаю сайты по порогу контраста 0.8 lst = table['Site'].values.tolist() restrict = restrict.loc[restrict['Recognition site'].isin(lst)] #оставляю только рестриктазы с сайтами из отфильтрованной таблицы restrict = restrict.loc[restrict['Putative']=='no'] #оставляю только экспериментально доказанные restrict.to_csv('out_list.tsv', sep='\t', index=False) #сохраняю итоговый список рестриктаз
Итерация | число находок выше порога (0,005) | id худшей находки выше порога | E-value | id лучшей находки ниже порога | E-value |
---|---|---|---|---|---|
1 | 20 | P17161.1 | 0.003 | P17160.1 | 0.005 |
2 | 28 | P9WMA8.1 | 0.003 | - | - |
3 | 29 | A0A1S4NYE3.2 | 0.004 | P33621.1 | 0.015 |
4 | 30 | D5CBA0.1 | 0.001 | - | - |
5 | 30 | P9WMA8.1 | 4e-19 | - | - |
6 | 30 | P9WMA8.1 | 5e-19 | - | - |