Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2021

Задание

1. Консервативный мотив в выравнивании последовательностей гомологичных белков

  1. Выберите домен из БД Pfam http://pfam-legacy.xfam.org/

    • такой, что выравнивание seed содержит менее сотни последовательностей и больше десятка. Подсказки будут содержать информацию о том, как выбрать домен
  2. Скачайте выравнивание seed. Обнаружен глюк в download: fasta файл скачивается без переносов строк. Лечение - используйте view вместо download.
  3. Откройте выравнивание в Jalview и найдите один или несколько консервативных мотивов.
    • Мотив может быть консервативным во всех последовательностях или в большей их части.
  4. Выберите для проверки один мотив, тот, который вам кажется имеющим наибольшее информационное содержание.
  5. Составьте паттерн, описывающий этот мотив.
  6. Выполните поиск по этому мотиву во всем выравнивании. Опишите и прокомментируйте результат.
  7. Выполните поиск по этому мотиву в базе данных SwissProt на сайте MyHits https://myhits.sib.swiss/cgi-bin/pattern_search. Опишите результат.

  8. (*) Проверьте есть ли среди находок "правильные" т.е. из семейства белков с выбранным вами доменом.
  9. Кратко опишите результаты в отчёте на вашем сайте

2. В том же выравнивании найдите мотив, специфичный для одной клады филогенетического дерева

  1. Постройте в Jalview филогенетическое дерево, одним из методов NJ или UPGMA
  2. Выберите ветвь, отрезающую одну кладу.
  3. Отделите выравнивание этой клады в отдельное окно. Найдите консервативный мотив в этой кладе
  4. Выполните поиск этого мотива во всем выравнивании. Опишите результат. Идеально если этот мотив встречается во всех последовательностях клады и не встречается больше нигде в выравнивании
  5. Опишите результат и сделайте выбор.

3. PSI-BLAST

Автор С.А.С.

Для данной последовательности белка составьте семейство гомологов, пользуясь PSI-BLAST

В отчёте приведите: выбранное AC, что это за белок (организм, функция), таблицу итераций, комментарии (сошлось/не сошлось, если нет, то почему, если да, то хорошее ли семейство и т.п.)

4. Проверьте гипотезу о том, что число TA в геноме меньше ожидаемого по статистике

  1. Материал: хромосома "вашей" бактерии. Достаточно одной, но если интересно проверьте для каждого репликона генома

  2. Метод: ожидаемое число слов TA оцените как

    • (число нуклеотидов в хромосоме) x (частота A в хромосоме) x (частота T в хромосоме)
      • иную оценку придумать сложно

В ответе: штамм, хромосома и её длина. Ожидаемое число слов TA, наблюдаемое и контраст - отношение наблюдаемого к ожидаемому. Достоверность отличия - если умеете её считать. Краткий вывод.

2021/4/task8 (последним исправлял пользователь aba 2023-04-07 07:36:50)