Сигналы и мотивы III
Для выполнения задания был выбран белок P39450 (Alcohol dehydrogenase class-3). Он относится к классу дегидрогеназ, широко распространенных белков, которые катализируют окисление спиртов и ацеталей до кетонов и альдегидов с использованием НАД+. Они также делятся на несколько классов, данный белок относится к классу III и был обнаружен у протеобактерии. Его последовательность была загружена в PSI-BLAST и были проведены пять итераций. Заполненную таблицу с данными можно скачать здесь, также результаты представлены на рисунке 1.
Как видно, окончательной стабилизации не произошло. Казалось, что она началась, так как в третьей итерации мы видим лишь небольшое увеличение числа найденных находок и увеличившийся разрыв в значениях E-value. Но четвертая и пятая итерации продемонстрировали обратное поведение. Возможно, это связано с распространенностью семейства, к которому принадлежит этот белок, и его важными функциями. Также стоит отметить, что, если в первой итерации все находки с E-value выше порогового принадлежали в основном к дегидрогеназам из самых разных организмах(от бактерий и грибов до растений и млекопитающих, то уже во второй итерации появились мембранный белки и множество синтаз.
Эндонуклеазы рестрикции
Целью данного практикума было нахождение наименее представленных комбинаций нуклеотидов в геноме бактерии Acidaminococcus fermentans DSM 20731 и эндонуклеаз рестрикции, им соответствующих.
Эндонуклеазы рестрикции - ферменты, которые являются катализаторами для реакции гидролиза нуклеиновых кислот. Они бывают трех типов и различаются по месту разрезания относительно сайта узнавания. Сайт узнавания - несколько нуклеотидов, специфично узнаваемых эндонуклеазами, бывают как симметричными, так и несимметричными, могут содержать разрывы и вырожденные буквы. Эндонуклеазы рестрикции бактерий являются частью системы рестрикции и модификации, благодаря которой расщепляется попавшая в клетку чужеродная ДНК. Чтобы защитить собственный геном, бактерия метилирует его, что препятствует расщеплению эндонуклеазами. Но это не абсолютная защита, поэтому в геноме идет отбор против набора нуклетидов, соответствующих сайтам узнавания эндонуклеаз. Такие возможные сайты и эндонуклеазы, узнавающие их, и были найдены в этом практикуме.
Командой cut -f5 TypeII_REs.tsv> pr8_1.txt был получен файл, содержащий сайты узнавания эндонуклеаз типа 2. Далее они были отсортированы и оставлены только уникальные последовательности (sort -u pr8_1.txt>pr8_2.txt), также был удален заголовок и сайт, состоящий из одного нуклеотида - цитозина.
Оценка представленности сайтов рестрикции была проведена с помощью программы CBcalc.
cbcalc -s pr8_2.txt -o pr8b.tsv -m 1 -K Acidanseq.fasta
Команда выдала список с сайтами рестрикции, их встречаемостью в геноме Acidaminococcus fermentans DSM 20731, ожидаемой встречаемостью и отношением этих двух величин. Порог, по которому отбирались недопредставленные сайты, был выбран 0.8 (как и предлагалось в задании), выше этого порога оказалось 8 сайтов рестрикции. Файл с ними был получен командой sort -k5,5g pr8b.tsv|head -n 9 >pr8_table.tsv.
Скачать файл со всеми сайтами.
Скачать файл с отобранными сайтами.
С помощью Excel были получены и отсортированы по алфавиту названия эндонуклеаз рестрикции. Их получилось 22, скачать файл можно здесь.