Сигналы и мотивы-3


Задание 1.

Для выполнения этого задания была выбрана Acidovorax species, так как в ней Р-М типа II с известными сайтами рестрикции.

Рис. 1.

Рис. 2. Карта генома выбранной бактерии. В ней есть Type II с известными сайтами рестрикции.

Затем геном выбранной бактерии был скачен из NCBI, он находится по ссылке.

Для того чтобы оценить представленности сайтов рестрикции в геноме выбранной бактерии была использована команда cbcalc: cbcalc -s Type2_REs.tsv -o out.tsv Acidovorax.fna. Результат

Далее полученный файл был отсортирован командой: sort -k5,5g out.tsv > out_sorted.tsv

Порог контраста был взят из условия задания, а именно 0.8: awk '$5 + 0 <= 0.8' out.tsv > result.tsv. Результат

Затем было необходимо узнать о рестриктазах, которые могут узнавать недопредставленные в геноме сайты: cut -f 5 Type2_REs.tsv |paste - Type2_REs.tsv |grep -E 'no'| cut -f 2-> final.txt.

Эта команда была необходима, потому что она выбрала из общего списка рестриктаз те, у которых в столбце Predicted записано no.

Как говорится: "Last but not least", задачей была отфильтровка списка рестриктаз на узнавание непредставленных сайтов. Это сделал скрипт Бетеньковой.Р

В итоговом файле осталось 95 записей о недопредставленных в геноме рестриктазах

Задание 2.

Был выбран идентификатор B2V8C0. Это белок MinC из бактерии рода Sulfurihydrogenibium sp., ингибитор деления клеток, блокирующий образование полярных Z-кольцевых перегородок.

Таблица.1
Номер итерацииЧисло находок выше порога (0.005)Идентификатор худшей находки выше порогаЕ-value этой находкиИдентификатор лучшей находки ниже порогаЕ-value этой находки
1163Q88M41.20,004Q4US07.10,006
2188Q9ZM51.16E-07A7H8E6.10,037
3188Q9ZM51.12E-11A7H8E6.10,025

Начиная со второй итерации, результат сошёлся. На всякий случай сделаем ещё одну итерацию, но результат был таким же. Полученные данные говорят о высокой консервативности белков, принадлежащих выбранному семейству.