Сигналы и мотивы Ⅲ

Задание 1. PSI-BLAST

Для выполнения этого задания я выбрала белок с идентификатором O05886. Этот белок носит название Ribosome hibernation promotion factor и необходим для димеризации активных 70S рибосом в 100S рибосомы в стационарной фазе. 100S рибосомы являются трансляционно неактивными.

С помощью PSI-BLAST я попыталась отыскать гомологов этого белка. Поиск я осуществляла по базе данных SwissProt, порог E-value составил 0.005 по умолчанию.

Скачать таблицу с итерациями можно по ссылке.

Можно заметить, что к шестой итерации результат стабилизировался: осталось прежним число находок с E-value выше порога. Также увеличилась разность между худшей находкой выше порога и лучшей находкой ниже порога, значит результат довольно качественный. Большинство хороших находок были среди бактерий (группа Террабактрий и Протеобактерий). Но были и находки с большим E-value среди различных эукариот и архей. В целом почти все найденные белки были функционально связаны с рибосомой. Попалось пару белков семейства нуклеаз (тРНК и рРНК).

Задание 2. Эндонуклеазы рестрикции

У прокариот и некоторых вирусов существует особая ферментативная система, система рестрикций и модификаций, позволяющая селективно расщеплять чужеродную ДНК, не затрагивая собственный генетический материал.

Эндонуклеазы способны с расщеплению фосфодиэфирных связей в цепочке ДНК. Порвать цепь они могут только при узнавании специфичной последовательности, как правило очень консервативной. Часто такие последовательности являются палиндромными и составляют 4-6 нуклеотидов в длину.

В геноме бактерии попадаются сайты, которые могут быть распознаны эндонуклеазами рестрикции. Чаще всего такие сайты метилированы, что служит защитой бактериальной ДНК от гидролиза. Однако случаются ошибки в работе ферментов, что может привести к расщеплению собственной ДНК. Поэтому отбор направлен против сайтов узнавания эндонуклеаз рестрикции.

Мы может предсказать, какие эндонуклеазы рестрикции функционируют в клетке бактерии, изучив представленность сайтов узнавания в геноме. Таким образом, самые "недопредставленные" сайты могут свидетельствовать, что в клетке функционируют эндонуклеазы, специфичные к последовательностям данных сайтов.

Получение списка потенциальных сайтов рестрикции

Для начала я вырезала столбец с последовательностями сайтов из готового файла с помощью команды:

cut -f 5 TypeII_REs.tsv > Recognition_sites.txt

Чтобы удалить повторяющиеся последовательности, я воспользовалась командой:

 sort -u Recognition_sites.txt >Recognition_sites_sorted.txt

Из файла я удалила прочерк и последовательность из одной буквы, поскольку она слишком коротка для сайта узнавания. Также был удалён заголовок. Ознакомиться с содержимым файла можно по ссылке.

Отбор недопредставленных сайтов

Я работала с бактерией Leuconostoc mesenteroides subsp. mesenteroides ATCC 8293. Её полный геном можно загрузить по ссылке

Чтобы оценить представленность последовательностей в геноме я воспользовалась программой CBcalc.Запрос выглядел следующим образом:

 cbcalc -s Recognition_sites_sorted.txt -o cbсalc1.tsv -K sequence.fasta

В полученном tsv-файле нас интересуют колонки с контрастом сайта по методу Карлина (O/E ratio (BCK)), с наблюдаемым числом сайтов в геноме (Observed) и ожидаемое количество сайтов (Expected (BCK)).

Чтобы найти наименее представленные сайты, я отсортировала данные в таблице Excel по возрастанию O/E ratio. Мне показался разумным порог 0,87 и меньше. Между этим значением и ближайшим по возрастанию (0,91) разность 0,4. Это достаточно большой шаг, поскольку между другими значениями шаг в основном составляет 0,1. В этот диапазон попало 6 последовательностей. Таблицу Excel можно загрузить по ссылке ссылке.

Отбор экспериментально проверенных эндонуклеаз

Далее я отобрала эндонуклеазы, специфичные к выбранным последовательностям. Из них я выбрала только те эндонуклеазы, белковая активность которых подтверждена ('no' в колонке Putative). Для этого я фильтровала данные в таблице Excel. По ссылке можно загрузить финальную таблицу с отобранными 17 ферментами.

Вернуться на главную