Учебная страница курса биоинформатики,
год поступления 2022
UNDER CONSTRUCTION
.
Отчёт по заданию должен быть открыт на вашей странице 4го семестра Срок без потери баллов — 3 мая 2024. Срок со штрафом 0,5 балла — 10 мая 2024.
Задание 1. Найдите консервативные мотивы в выравнивании
Выберите домен из БД Pfam http://pfam-legacy.xfam.org/,
- такой, что выравнивание seed содержит менее пары сотен последовательностей но больше пары десятков.
Ещё одно ограничение. В SwissProt белков с доменом менее 500. В таблице такой графы нет, ориентируйтесь на Uniprot (думаю, в SwissProt белков с доменом раз в 20 меньше)
См. "пояснения", интерфейс Pfam изменился, так как Pfam поглощён консорциумом InterPro.
- такой, что выравнивание seed содержит менее пары сотен последовательностей но больше пары десятков.
- Скачайте выравнивание seed.
- Найдите мотив, консервативный во всех (или почти всех) белках. По аннотации домена и литературе постарайтесь выбрать известный мотивов. Если нет - выбирайте мотив с лучшим информационным содержанием.
- Составьте паттерн Jalview этого мотива.
- Выполните поиск по этому паттерну во всем выравнивании. Опишите и прокомментируйте результат.
- Переведите паттерн в формат Prosite
Выполните поиск по этому паттерну в базе данных SwissProt в PROSITE (https://prosite.expasy.org/) Опишите результат.
(*) Проверьте все ли находки в SwissProt - в белках содержащих выбранный домен
Результаты и выводы опишите в отчёте
2. В том же выравнивании найдите мотив, специфичный для одной клады филогенетического дерева
- Постройте в Jalview филогенетическое дерево, одним из методов NJ или UPGMA
- Выберите ветвь, отрезающую одну кладу.
- Отделите выравнивание этой клады в отдельное окно. Найдите консервативный мотив в этой кладе
- Выполните поиск этого мотива во всем выравнивании. Опишите результат. Идеально если этот мотив встречается во всех последовательностях клады и не встречается больше нигде в выравнивании
- Опишите результат и сделайте вывод о том, специфичен ли мотив для клады или нет.
3. PSI-BLAST
Автор С.А.С.
Для данной последовательности белка составьте семейство гомологов, пользуясь PSI-BLAST
Выберите случайный идентификатор (AC) из списка.
- Зайдите на страницу белкового BLAST в NCBI, внесите выбранный AC в окошко, выберите PSI-BLAST и поиск по банку Swiss-Prot.
После каждой итерации заполняйте строку таблицы.
- Желательный результат: стабилизация результата очередной итерации, т.е. список находок выше порога не поменялся по сравнению с предыдущей итерацией. Если не удалось стабилизировать результат, то выполните не менее пяти итераций.
- Качество результата также определяется "ступенькой" E-value между худшей "правильной" находкой и "лучшей" неправильной: чем больше разница, тем вероятнее, что находки составляют семейство гомологичных белков.
- При необходимости можно изменить порог E-value отсечения хороших находок (E=0.005 по умолчанию).
В отчёте приведите: выбранное AC, что это за белок (организм, функция), таблицу итераций, комментарии (сошлось/не сошлось, если нет, то почему, если да, то хорошее ли семейство и т.п.)
4. В выборке поледовательностей с доменом из SwissProt найдите de novo мотивы с помощью MEME
5. Оцените представленность сайта GATC в геноме "вашей" бактерии
Постройте гистограмму контрастов obs/exp по методу Карлина с соав. для этого сайта и, для сравнения, всех сайтов длины 4, полученных перестановками (без повторений) букв A, T, G, C. Программа cbcalc для вычисления контрастов установлена на kodomo.
Согласно литературным данным метилирование сайта GATC играет важную роль в репарации неправильно спаренных оснований у бактерий, старте репликации и других процессах [1]. Метилируется аденин сайта по 6му положению хорошо изученной ДНК метилтрансферазой dam [2].
[1] Marinus MG, Casadesus J. Roles of DNA adenine methylation in host-pathogen interactions: mismatch repair, transcriptional regulation, and more. FEMS Microbiol Rev. 2009
[2] Wu X, et al.,Epigenetic competition reveals density-dependent regulation and target site plasticity of phosphorothioate epigenetics in bacteria. Proc Natl Acad Sci U S A. 2020