Учебная страница курса биоинформатики,
год поступления 2019
Рекомендую скачать и установить редактор выравнивания Genedoc.
Он только под Windows. В других ОС придется установить эмулятор Windows.
Зачем устанавливать этот древний редактор? За простоту и честность Затем, что он не думает за вас. В данном случае важна раскраска по консервативности, контролируемая вами.
У Jalview есть замечательные преимущества, в нем можно открывать огромные выравнивания, и он не тормозит. Из него можно вызвать программы выравнивания, скачать последовательности и выравнивания из баз данных, привязать структуру к последовательности. Но раскраска выравнивания у него безобразная.
Можно ли выполнить все задания в Jalview? Можно. Но будьте очень аккуратны при выделении блоков, консервативных позиций и функционально консервативных позиций - легко ошибиться из-за многоцветия.
Задания по теме Alignment&Pfam
1. Описать информацию, доступную в Pfam по одному домену
- Выбрать домен. Можно взять любимый белок, определить его доменную архитектуру в Pfam и взять один из доменов.
- Включите в отчёт название, ID, AC и функцию домена (коротко)
- Укажите число последовательностей (full) и число последовательностей в выравнивании seed
- Укажите число доменных архитектур с этим доменом
- Укажите другие домены, приятели данного, и покажите одну или несколько доменных архитектур, включающих доменом и его приятеля. Приятелем назовем домен, часто встречающийся с данным, и возможно в разных доменных архитектурах. Определяется на глазок и по функции.
- Укажите число 3D структур доменов из разных последовательностей. Разные структуры одного и того же белка (по Uniprot ID) считать за одну.
- Укажите число белков с доменом по таксонам самого высокого ранга. Типично - по суперцарствам(они же домены жизни) - бактерии, археи, эукариоты.Если все белки, например, из Firmicutes, то берите след. по рангу таксоны.
- Посмотрите на HMM профиль выравнивания и укажите дату создания (в начале файла) и число позиций (номера позиций указаны в первой колонке профиля).
2.Анализ выравнивания из Pfam
- Выберите небольшую (не более нескольких десятков) выборку последовательностей белков с доменом, пользуясь Sunburst. Выделите веточку с подходящим числом последовательностей; следите, чтобы число видов было больше 10. Запишите какой таксон и сколько последовательностей
- Скачайте выравнивание или (лучше) последовательности в фаста формате.
- Откройте в Jalview и выровняйте если нужно
- Проведите ревизию выравнивания. Удалите фрагменты и последовательности подозрительно сильно отличающиеся от остальных. Задача ревизии оставить выравнивание, в котором есть хорошие вертикальные блоки, но чтобы последовательности не были почти идентичными. См. след. пункты задания. Должно остаться от 7 до 20 последовательностей.
- Сохраните Jalview проект с исходным выравниванием и выравниванием после ревизии.
- Сохраните получившееся выравнивание в формате msf (Genedoc любит) или фаста.
- Открыть выравнивание в Genedoc
Найдите консервативный вертикальный блок (объяснение про блоки см. в презентации)
- Найдите консервативный блок, включающий не все последовательности
- Найдите вертикальный блок (прямоугольник) в выравнивании. В котором нет оснований предполагать гомологичность фрагментов: в идеале никакие два не похожи настолько, что можно предполагать гомологичность.
- (*) Найдите и исправьте одну ошибку в выравнивании
3. Найти все белки с данным доменом Pfam
- а. В Uniprot по запросу получите таблицу всех белков содержащих домен.
- укажите число находок и число находок в Swissprot (reviewed)
- Добавьте к таблице колонки cross-reference(Pfam) и cross-reference(PROSITE); и тот уровень таксона, который использовали в задании 1.
- Сохраните таблицу в формате Excel
- Выберите одну доменную архитектуру и посчитайте число белков с такой доменной архитектурой.
- Посчитайте число белков по таксонам выбранного уровня.
- Сравните с данными Pfam
- Определите какой домен PROSITE соответствует выбранному домену Pfam.
Напишите что-нибудь про задание и выводы.
Дополнительное задание
4.(*) Проверить выравнивание по совмещению структур
- Выберите 3-5 белка с доменом, у которых известна 3D структура. Запомните PDB код и цепочку для них.
- Постройте выравнивания последовательностей.
- Постройте совмещение структур. Посмотрите на совмещенные структуры - хорошее ли совмещение полипептидных цепей.
- Сохраните выравнивание, построенное сервером по совмещению полипептидных цепей.
- Сравните выравнивания и напишите вывод.