Сигналы и мотивы III

Для выполнения задания был выбран белок P39450 (Alcohol dehydrogenase class-3). Он относится к классу дегидрогеназ, широко распространенных белков, которые катализируют окисление спиртов и ацеталей до кетонов и альдегидов с использованием НАД+. Они также делятся на несколько классов, данный белок относится к классу III и был обнаружен у протеобактерии. Его последовательность была загружена в PSI-BLAST и были проведены пять итераций. Заполненную таблицу с данными можно скачать здесь, также результаты представлены на рисунке 1.

Результат PSI-BLAST
Рисунок 1. Результат PSI-BLAST.

Пятая итерация
Рисунок 2. Пятая итерация.

Как видно, окончательной стабилизации не произошло. Казалось, что она началась, так как в третьей итерации мы видим лишь небольшое увеличение числа найденных находок и увеличившийся разрыв в значениях E-value. Но четвертая и пятая итерации продемонстрировали обратное поведение. Возможно, это связано с распространенностью семейства, к которому принадлежит этот белок, и его важными функциями. Также стоит отметить, что, если в первой итерации все находки с E-value выше порогового принадлежали в основном к дегидрогеназам из самых разных организмах(от бактерий и грибов до растений и млекопитающих, то уже во второй итерации появились мембранный белки и множество синтаз.

Эндонуклеазы рестрикции

Целью данного практикума было нахождение наименее представленных комбинаций нуклеотидов в геноме бактерии Acidaminococcus fermentans DSM 20731 и эндонуклеаз рестрикции, им соответствующих.

Эндонуклеазы рестрикции - ферменты, которые являются катализаторами для реакции гидролиза нуклеиновых кислот. Они бывают трех типов и различаются по месту разрезания относительно сайта узнавания. Сайт узнавания - несколько нуклеотидов, специфично узнаваемых эндонуклеазами, бывают как симметричными, так и несимметричными, могут содержать разрывы и вырожденные буквы. Эндонуклеазы рестрикции бактерий являются частью системы рестрикции и модификации, благодаря которой расщепляется попавшая в клетку чужеродная ДНК. Чтобы защитить собственный геном, бактерия метилирует его, что препятствует расщеплению эндонуклеазами. Но это не абсолютная защита, поэтому в геноме идет отбор против набора нуклетидов, соответствующих сайтам узнавания эндонуклеаз. Такие возможные сайты и эндонуклеазы, узнавающие их, и были найдены в этом практикуме.

Командой cut -f5 TypeII_REs.tsv> pr8_1.txt был получен файл, содержащий сайты узнавания эндонуклеаз типа 2. Далее они были отсортированы и оставлены только уникальные последовательности (sort -u pr8_1.txt>pr8_2.txt), также был удален заголовок и сайт, состоящий из одного нуклеотида - цитозина.

Скачать файл со всеми сайтами

Оценка представленности сайтов рестрикции была проведена с помощью программы CBcalc.

cbcalc -s pr8_2.txt -o pr8b.tsv -m 1 -K Acidanseq.fasta

Команда выдала список с сайтами рестрикции, их встречаемостью в геноме Acidaminococcus fermentans DSM 20731, ожидаемой встречаемостью и отношением этих двух величин. Порог, по которому отбирались недопредставленные сайты, был выбран 0.8 (как и предлагалось в задании), выше этого порога оказалось 8 сайтов рестрикции. Файл с ними был получен командой sort -k5,5g pr8b.tsv|head -n 9 >pr8_table.tsv.

Скачать файл со всеми сайтами.

Скачать файл с отобранными сайтами.

С помощью Excel были получены и отсортированы по алфавиту названия эндонуклеаз рестрикции. Их получилось 22, скачать файл можно здесь.