На главную На страницу четвёртого семестра
— — — — — — — —
Задание №1
Был выбран AC: O05886. Это белок – Ribosome hibernation promotion factor. Присутствует в организме – Mycobacterium tuberculosis (strain ATCC 25618 / H37Rv). Данный вид микобактерий вызывает туберкулез у человека и некотрых животных. На сайте UniProt было найдено краткое описание функции белка: ответственнен за димеризацию активных 70S рибосом в 100S рибосомы в стационарной фазе.
Как видно из таблицы результаты стабилизировались к 5 итерации, для проверки была выполнена еще и шестая. Так как качество результата определяется "ступенькой" E-value между худшей "правильной" находкой и "лучшей" (а здесь, начиная с пятой итерации разница большая), можно говорить, что данные находки с большой вероятностью составляют семейство гомологичных белков.
Задание №2
Моя бактерия – Streptococcus mutans UA159
Для отбора нужных сайтов была написана программа (Jupiter notebook, python). Были отобраны все сайты, имеющие длину более 2 нуклеотидов.
Для расчёта представленности сайтов была использована программа CBcalc (cbcalc --burge -s pr_8_2_1.txt -o pr_8_2_2.tsv sequence.fasta). Далее для отбора наименее представленных сайтов был написан другой скрипт (Jupiter notebook, python, входная таблица для скрипта). Были выбраны сайты имещие значение O/E (контраст сайта по методу Карлина и соавторов, заключающийся в подсчёте ожидаемого числа встреч данного сайта и реального числа; "O/E" расшифровывается как "Observed/Expected", то есть является отношением наблюдаемого числа встреч и ожидаемого) менее 0,8. Это довольно разумный порог, так как таких сайтов получилось не очень много, установка порога ниже привела бы к тому, что вообще почти ничего бы не нашлось.
На последнем этапе из изначальной таблицы эндонуклеаз были отобраны те, которые специфичны к наименее представленным сайтам и имеют значение "no" в колонке "Putative".
Скачать Jupiter notebook скрипта Скачать python скрипт Скачать результат в csv формате