Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2022

UNDER CONSTRUCTION

https://kodomo.fbb.msu.ru/FBB/year_18/images/construction1.png.

Отчёт по заданию должен быть открыт на вашей странице 4го семестра Срок без потери баллов — 3 мая 2024. Срок со штрафом 0,5 балла — 10 мая 2024.

Задание 1. Найдите консервативные мотивы в выравнивании

  1. Выберите домен из БД Pfam http://pfam-legacy.xfam.org/,

    • такой, что выравнивание seed содержит менее пары сотен последовательностей но больше пары десятков.

      Ещё одно ограничение. В SwissProt белков с доменом менее 500. В таблице такой графы нет, ориентируйтесь на Uniprot (думаю, в SwissProt белков с доменом раз в 20 меньше)

      См. "пояснения", интерфейс Pfam изменился, так как Pfam поглощён консорциумом InterPro.

  2. Скачайте выравнивание seed.
  3. Найдите мотив, консервативный во всех (или почти всех) белках. По аннотации домена и литературе постарайтесь выбрать известный мотивов. Если нет - выбирайте мотив с лучшим информационным содержанием.
  4. Составьте паттерн Jalview этого мотива.
  5. Выполните поиск по этому паттерну во всем выравнивании. Опишите и прокомментируйте результат.
  6. Переведите паттерн в формат Prosite
  7. Выполните поиск по этому паттерну в базе данных SwissProt в PROSITE (https://prosite.expasy.org/) Опишите результат.

  8. (*) Проверьте все ли находки в SwissProt - в белках содержащих выбранный домен

Результаты и выводы опишите в отчёте

2. В том же выравнивании найдите мотив, специфичный для одной клады филогенетического дерева

  1. Постройте в Jalview филогенетическое дерево, одним из методов NJ или UPGMA
  2. Выберите ветвь, отрезающую одну кладу.
  3. Отделите выравнивание этой клады в отдельное окно. Найдите консервативный мотив в этой кладе
  4. Выполните поиск этого мотива во всем выравнивании. Опишите результат. Идеально если этот мотив встречается во всех последовательностях клады и не встречается больше нигде в выравнивании
  5. Опишите результат и сделайте вывод о том, специфичен ли мотив для клады или нет.

3. PSI-BLAST

Автор С.А.С.

Для данной последовательности белка составьте семейство гомологов, пользуясь PSI-BLAST

В отчёте приведите: выбранное AC, что это за белок (организм, функция), таблицу итераций, комментарии (сошлось/не сошлось, если нет, то почему, если да, то хорошее ли семейство и т.п.)

4. В выборке поледовательностей с доменом из SwissProt найдите de novo мотивы с помощью MEME

5. Оцените представленность сайта GATC в геноме "вашей" бактерии

Постройте гистограмму контрастов obs/exp по методу Карлина с соав. для этого сайта и, для сравнения, всех сайтов длины 4, полученных перестановками (без повторений) букв A, T, G, C. Программа cbcalc для вычисления контрастов установлена на kodomo.

Согласно литературным данным метилирование сайта GATC играет важную роль в репарации неправильно спаренных оснований у бактерий, старте репликации и других процессах [1]. Метилируется аденин сайта по 6му положению хорошо изученной ДНК метилтрансферазой dam [2].

[1] Marinus MG, Casadesus J. Roles of DNA adenine methylation in host-pathogen interactions: mismatch repair, transcriptional regulation, and more. FEMS Microbiol Rev. 2009

[2] Wu X, et al.,Epigenetic competition reveals density-dependent regulation and target site plasticity of phosphorothioate epigenetics in bacteria. Proc Natl Acad Sci U S A. 2020

2022/4/task10 (последним исправлял пользователь aba 2024-04-26 10:02:51)