Kodomo

Пользователь

Учебная страница курса биоинформатики,
год поступления 2019

Рекомендую скачать и установить редактор выравнивания Genedoc.

Он только под Windows. В других ОС придется установить эмулятор Windows.

Зачем устанавливать этот древний редактор? За простоту и честность Затем, что он не думает за вас. В данном случае важна раскраска по консервативности, контролируемая вами.

У Jalview есть замечательные преимущества, в нем можно открывать огромные выравнивания, и он не тормозит. Из него можно вызвать программы выравнивания, скачать последовательности и выравнивания из баз данных, привязать структуру к последовательности. Но раскраска выравнивания у него безобразная.

Можно ли выполнить все задания в Jalview? Можно. Но будьте очень аккуратны при выделении блоков, консервативных позиций и функционально консервативных позиций - легко ошибиться из-за многоцветия.

Задания по теме Alignment&Pfam

1. Описать информацию, доступную в Pfam по одному домену

  1. Выбрать домен. Можно взять любимый белок, определить его доменную архитектуру в Pfam и взять один из доменов.
  2. Включите в отчёт название, ID, AC и функцию домена (коротко)
  3. Укажите число последовательностей (full) и число последовательностей в выравнивании seed
  4. Укажите число доменных архитектур с этим доменом
  5. Укажите другие домены, приятели данного, и покажите одну или несколько доменных архитектур, включающих доменом и его приятеля. Приятелем назовем домен, часто встречающийся с данным, и возможно в разных доменных архитектурах. Определяется на глазок и по функции.
  6. Укажите число 3D структур доменов из разных последовательностей. Разные структуры одного и того же белка (по Uniprot ID) считать за одну.
  7. Укажите число белков с доменом по таксонам самого высокого ранга. Типично - по суперцарствам(они же домены жизни) - бактерии, археи, эукариоты.Если все белки, например, из Firmicutes, то берите след. по рангу таксоны.
  8. Посмотрите на HMM профиль выравнивания и укажите дату создания (в начале файла) и число позиций (номера позиций указаны в первой колонке профиля).

2.Анализ выравнивания из Pfam

  1. Выберите небольшую (не более нескольких десятков) выборку последовательностей белков с доменом, пользуясь Sunburst. Выделите веточку с подходящим числом последовательностей; следите, чтобы число видов было больше 10. Запишите какой таксон и сколько последовательностей
  2. Скачайте выравнивание или (лучше) последовательности в фаста формате.
  3. Откройте в Jalview и выровняйте если нужно
  4. Проведите ревизию выравнивания. Удалите фрагменты и последовательности подозрительно сильно отличающиеся от остальных. Задача ревизии оставить выравнивание, в котором есть хорошие вертикальные блоки, но чтобы последовательности не были почти идентичными. См. след. пункты задания. Должно остаться от 7 до 20 последовательностей.
  5. Сохраните Jalview проект с исходным выравниванием и выравниванием после ревизии.
  6. Сохраните получившееся выравнивание в формате msf (Genedoc любит) или фаста.
  7. Открыть выравнивание в Genedoc
  8. Найдите консервативный вертикальный блок (объяснение про блоки см. в презентации)

  9. Найдите консервативный блок, включающий не все последовательности
  10. Найдите вертикальный блок (прямоугольник) в выравнивании. В котором нет оснований предполагать гомологичность фрагментов: в идеале никакие два не похожи настолько, что можно предполагать гомологичность.
  11. (*) Найдите и исправьте одну ошибку в выравнивании

3. Найти все белки с данным доменом Pfam

Напишите что-нибудь про задание и выводы.

Дополнительное задание

4.(*) Проверить выравнивание по совмещению структур

  1. Выберите 3-5 белка с доменом, у которых известна 3D структура. Запомните PDB код и цепочку для них.
  2. Постройте выравнивания последовательностей.
  3. Постройте совмещение структур. Посмотрите на совмещенные структуры - хорошее ли совмещение полипептидных цепей.
  4. Сохраните выравнивание, построенное сервером по совмещению полипептидных цепей.
  5. Сравните выравнивания и напишите вывод.