Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2023

Задание на дом

Отчёт по заданию должен быть открыт на вашей странице 4го семестра Срок без потери баллов — 21 апреля 2025. Срок со штрафом 0,5 балла — 25 апреля 2025 - перед колоквиумом.

Задание 1. Найдите консервативные мотивы в выравнивании

  1. Выберите домен из БД Pfam http://pfam-legacy.xfam.org/,

    • такой, что выравнивание seed содержит менее пары сотен последовательностей но больше пары десятков.

      Ещё одно ограничение. В SwissProt белков с доменом менее 500. В таблице такой графы нет, ориентируйтесь на Uniprot (думаю, в SwissProt белков с доменом раз в 20 меньше)

      См. "пояснения", интерфейс Pfam изменился, так как Pfam поглощён консорциумом InterPro.

  2. Скачайте выравнивание seed.
  3. Найдите мотив, консервативный во всех (или почти всех) белках. По аннотации домена и по литературе постарайтесь выбрать известный мотивов. Если нет - выбирайте мотив с лучшим информационным содержанием.
  4. Составьте паттерн Jalview этого мотива.
  5. Выполните поиск по этому паттерну во всем выравнивании. Опишите и прокомментируйте результат.
  6. Переведите паттерн в формат Prosite
  7. Выполните поиск по этому паттерну в базе данных SwissProt в PROSITE (https://prosite.expasy.org/) Опишите результат.

  8. (*) Проверьте все ли находки в SwissProt - в белках содержащих выбранный домен

Результаты и выводы опишите в отчёте

2. В том же выравнивании найдите мотив, специфичный для одной клады филогенетического дерева

  1. Постройте в Jalview филогенетическое дерево, одним из методов NJ или UPGMA
  2. Выберите ветвь, отрезающую одну кладу.
  3. Отделите выравнивание этой клады в отдельное окно. Найдите консервативный мотив в этой кладе и постройте его паттерн.
  4. Выполните поиск этого мотива во всем выравнивании. Опишите результат. Идеально если этот мотив встречается во всех последовательностях клады и не встречается больше нигде в выравнивании
  5. Опишите результат и сделайте вывод о том, специфичен ли мотив для клады или нет.

3. PSI-BLAST

Автор С.А.С.

Для данной последовательности белка составьте семейство гомологов, пользуясь PSI-BLAST

В отчёте приведите: выбранное AC, что это за белок (организм, функция), таблицу итераций, комментарии (сошлось/не сошлось, если нет, то почему, если да, то хорошее ли семейство и т.п.)

4. В выборке поледовательностей с доменом из SwissProt найдите de novo мотивы с помощью MEME

5. Оцените представленность сайта GATC в геноме "вашей" бактерии

Постройте гистограмму контрастов obs/exp по методу Карлина с соав. для этого сайта и, для сравнения, всех сайтов длины 4, полученных перестановками (без повторений) букв A, T, G, C. Программа cbcalc для вычисления контрастов установлена на kodomo.

Согласно литературным данным метилирование сайта GATC играет важную роль в репарации неправильно спаренных оснований у бактерий, старте репликации и других процессах [1]. Метилируется аденин сайта по 6му положению хорошо изученной ДНК метилтрансферазой dam [2].

[1] Marinus MG, Casadesus J. Roles of DNA adenine methylation in host-pathogen interactions: mismatch repair, transcriptional regulation, and more. FEMS Microbiol Rev. 2009

[2] Wu X, et al.,Epigenetic competition reveals density-dependent regulation and target site plasticity of phosphorothioate epigenetics in bacteria. Proc Natl Acad Sci U S A. 2020

2023/4/task10 (последним исправлял пользователь aba 2025-04-11 00:33:23)