Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2018

0. Прочитайте презентацию signals-unsaid.pptx

1. PSI-BLAST

Автор С.А.С.

Для данной последовательности белка составьте семейство гомологов, пользуясь PSI-BLAST

В отчёте приведите: выбранное AC, что это за белок (организм, функция), таблицу итераций, комментарии (сошлось/не сошлось, если нет, то почему, если да, то хорошее ли семейство и т.п.)

2. Эндонуклеазы рестрикции

Срок выполнения без потери баллов – 24:00 5 апреля (воскресенье).

— ИР

Ваша задача – попытаться предсказать специфичность некоторых эндонуклеаз рестрикции в геноме своей бактерии/археи.

Эндонуклеазы рестрикции обладают очень высокой специфичностью к последовательности ДНК, зачастую они узнают одну определенную короткую последовательность. Поэтому для описания соответствующего сигнала не нужно составлять ПВМ, достаточно просто указать последовательность сайта узнавания. Метилирование сайтов узнавания в хозяйской ДНК защищает их от воздействия соответствующей эндонуклеазы. Однако, эндонуклезы рестрикции иногда все-таки гидролизуют клеточную ДНК, например, из-за ошибок при метилировании сайтов. Поэтому даже в клеточной ДНК существует отбор против сайтов узнавания эндонуклеаз рестрикции, ведь чем меньше сайтов в ДНК, тем меньше шанс её случайного гидролиза.

Идея: можно попытаться предсказать специфичность эндонуклеаз рестрикции бактерии по списку возможных сайтов узнавания, которые избегаются (т.е. недопредставлены) в её геноме. Для этого достаточно иметь последовательность генома бактерии (даже не обязательно полную) и знать список сайтов, которые потенциально могут быть сайтами узнавания эндонуклеаз рестрикции.

Этапы работы:

  1. получить список коротких последовательностей (сайтов), которые являются потенциальными сайтами рестрикции;
  2. оценить представленность этих сайтов в геноме своей бактерии/археи, выбрать наиболее недопредставленные сайты;
  3. получить список экспериментально проверенных эндонуклеаз рестрикции, известная специфичность которых соответствует этим недопредставленным сайтам;
  4. (*) получить последовательности этих эндонуклеаз и запустить поиск потенциальных гомологов в геноме вашей бактерии/археи.

Технические рекомендации по выполнению пунктов здесь.

Наиболее полной базой данных, содержащей информацию о системах рестрикции-модификации (и, в частности, об эндонуклеазах рестрикции), является REBASE. Для вашего удобства, необходимая информация уже загружена и предварительно обработана. В файле /P/y18/term4/pr8/TypeII_REs.tsv (tsv – tab-separated values) содержится список всех известных на данный момент эндонуклеаз рестрикции типа II.

Поля файла, которые могут Вам понадобиться:

REBASE name
имя эндонуклеазы в базе REBASE
System type
тип системы Р-М, т.е. всегда Type II
Protein type
тип компонента системы, т.е. всегда R
Recognition site
последовательность сайта узнавания, если известна
Putative
no, если была хоть какая-то экспериментальная проверка активности белка

В файле /P/y18/term4/pr8/TypeII_REs.fasta содежатся последовательности эндонуклеаз для желающих выполнить пункт 4.

Результат выполения – страничка на сайте. Из текста должно быть понятно, что и для чего Вы делали, не только преподавателям, но и более менее постороеннему человеку. Обязательно надо указать, как выполняли каждый из этапов. Копировать текст задания и подсказок запрещается. Технически, это плагиат. Формулируйте все своими словами.

Пункт 4 оценивается, только если выполнен качественно. Недостаточно запустить бласт и дать ссылку на файл с находками. В идеале, можно даже зайти на сайт REBASE, поискать информацию о системах Р-М вашей бактерии/археи или системах ближайших родственников и сравнить с вашими результатами.