Практикум №8

На главную На страницу четвёртого семестра

— — — — — — — —

Задание №1

Был выбран AC: O05886. Это белок – Ribosome hibernation promotion factor. Присутствует в организме – Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv). Данный вид микобактерий вызывает туберкулез у человека и некотрых животных. На сайте UniProt было найдено краткое описание функции белка: ответственнен за димеризацию активных 70S рибосом в 100S рибосомы в стационарной фазе.

Скачать таблицу

Как видно из таблицы результаты стабилизировались к 5 итерации, для проверки была выполнена еще и шестая. Так как качество результата определяется "ступенькой" E-value между худшей "правильной" находкой и "лучшей" (а здесь, начиная с пятой итерации разница большая), можно говорить, что данные находки с большой вероятностью составляют семейство гомологичных белков.

Задание №2

Моя бактерия – Streptococcus mutans UA159

Для отбора нужных сайтов была написана программа (Jupiter notebook, python). Были отобраны все сайты, имеющие длину более 2 нуклеотидов.

Для расчёта представленности сайтов была использована программа CBcalc (cbcalc --burge -s pr_8_2_1.txt -o pr_8_2_2.tsv sequence.fasta). Далее для отбора наименее представленных сайтов был написан другой скрипт (Jupiter notebook, python, входная таблица для скрипта). Были выбраны сайты имещие значение O/E (контраст сайта по методу Карлина и соавторов, заключающийся в подсчёте ожидаемого числа встреч данного сайта и реального числа; "O/E" расшифровывается как "Observed/Expected", то есть является отношением наблюдаемого числа встреч и ожидаемого) менее 0,8. Это довольно разумный порог, так как таких сайтов получилось не очень много, установка порога ниже привела бы к тому, что вообще почти ничего бы не нашлось.

Скачать результат

На последнем этапе из изначальной таблицы эндонуклеаз были отобраны те, которые специфичны к наименее представленным сайтам и имеют значение "no" в колонке "Putative".

Скачать Jupiter notebook скрипта Скачать python скрипт Скачать результат в csv формате