Задание 1

Рестрикция-модификация - механизм, благодаря которому клетка уничтожает чужеродную ДНК. Он осуществляется одним либо несколькими ферментами, которые обладают нуклеазной (разрезают неметилированную ДНК) и метилтрансферазной (метилируют собственную ДНК) активностями. Для предотвращения повреждения собственной ДНК в геноме сайты рестрикци встречаются редко.

Для анализа выбрала Arachidicoccus species BS20. pic Поиск недопредставленных сайтов рестрикции в геноме осуществляла при помощи скрипта:

#!/usr/bin/env python3
import subprocess
import pandas
subprocess.run('cbcalc -s TypeII_REs.tsv -o out.tsv  sequence.fasta', shell=True)
#поиск сайтов рестрикции
restrict = pandas.read_csv('TypeII_REs.tsv', sep='\t')
table = pandas.read_csv('out.tsv', sep='\t')
table = table.loc[table['Site'].str.len() > 2].drop_duplicates(keep='first')
#фильтрую по длине сайта и удаляю дупликаты
table = table.loc[table['O/E ratio (MM)']<0.8] #отсекаю сайты по порогу контраста 0.8
lst = table['Site'].values.tolist()
restrict = restrict.loc[restrict['Recognition site'].isin(lst)] 
#оставляю только рестриктазы с сайтами из отфильтрованной таблицы
restrict = restrict.loc[restrict['Putative']=='no'] 
#оставляю только экспериментально доказанные
restrict.to_csv('out_list.tsv', sep='\t', index=False) 
#сохраняю итоговый список рестриктаз

Задание 2

В этом задании я изучала фактор способствующий гибернации рибосом(HPF, O05886). Во время стационарной фазы роста HPF участвует в димеризации большинства 70S рибосом до 100S.
Для поиска гомологов данного белка был использован PSI-BLAST. До стабилизации числа находок и достижения значимой разности e-val выполнила 6 итераций. Результаты представлены в таблице:
Итерация число находок выше порога (0,005) id худшей находки выше порога E-value id лучшей находки ниже порога E-value
1 20 P17161.1 0.003 P17160.1 0.005
2 28 P9WMA8.1 0.003 - -
3 29 A0A1S4NYE3.2 0.004 P33621.1 0.015
4 30 D5CBA0.1 0.001 - -
5 30 P9WMA8.1 4e-19 - -
6 30 P9WMA8.1 5e-19 - -
Вероятно, находки составляют семейство гомологичных белков с высокой степенью сходства.