Практическая биоинформатика для I курса школы биоинформатики (весна 2014)
Преподаватель: Сергей Александрович Спирин sas@fbb.msu.ru и sergei.spirin@gmail.com (оба mail'а сейчас работают!).
Последнее занятие: 14 мая. Зачёт будет ставится по присланным результатам выполнения заданий. На занятии 14 мая можно будет доделать то, что не получилось.
Задания 7
- Найдите для трёх ваших белков PDB-коды структур наиболее близких белков с представленной в PDB структурой. Для каждого укажите PDB-код, тип экспериментальных данных (X-ray такого-то разрешения или NMR) идентификатор цепи (цепей) представляющей белок, % идентичности с вашим белком, а также какая часть вашего белка представлена 3D структурой его самого или гомолога (в виде "X остатков из Y").
Указания. На сайте PDB слева вверху пройти по гиперссылке "Advanced", в разделе "Choose a query type" выберите "Sequence" и скопируйте в окошко Sequence последовательность. После нажатия кнопки "Search" список находок появится под голубой чертой (ниже раздела Query refinements"). Чтобы увидеть характеристики выравнивания, нажмите малозаметную гиперссылку "Display full alignment".
Запустите Jmol и откройте какую-нибудь PDB-запись (File → Get PDB). Испытайте действие всех сочетаний клавиш <Ctrl> и <Shift> с кнопками мыши и движениями мыши по вертикали и горизонтали. Занесите в протокол описание эффекта каждого сочетания (лучше в виде таблицы).
- Создайте изображения одной из цепей белка в выбранной записи в четырёх визуализациях: шариковой, проволочной, шарнирной и остовной; экспортируйте изображения в графические файлы.
Указания. Щелчок правой кнопки мыши по графическому полю вызывает меню, в котором надо выбрать "Консоль" (окошко с командной строкой). Далее смотрите мини учебник по RasMol (Jmol понимает почти все команды RasMol'а).
Чтобы научиться более изощрённой визуализации в Jmol, смотрите онлайн-справочник команд, особое внимание обратите на раздел "atom expressions".
_
Презентация по филогенетическим деревьям
Задания 6
Постройте филогенетические деревья по интересующему вас набору последовательностей белков.
Можно, например, взять один из белков, с которыми вы работали при выполнении предыдущий заданий, и первые находки при поиске BLAST'ом его родственников в нескольких таксонах.
Если белки включают по нескольку эволюционных доменов (см. задания 5), то разумно строить дерево только по последовательности одного из доменов (исключение – если все белки набора имеют одинаковые доменные архитектуры, и при этом аннотированными доменами практически исчерпываются их последовательности. Так или иначе, белки должны быть гомологичны по всей длине.)
Постройте деревья двумя-тремя методами (можно использовать JalView, но лучше – MEGA или программы neighbor или fitch из пакета PHYLIP). Укажите, совпадают ли деревья по топологии, если нет – какие ветви присутсвуют в одном дереве, но отсутствуют в другом.
Пришлите изображения деревьев и протокол с указанием всех заслуживающих внимания обстоятельств процесса и результата.
Задания 5
Отчёт по всем заданиям – в виде протокола с описанием результатов, по заданию 1 присылайте также сохранённые проекты Jalview (jar-файлы).
- Для трёх своих белков определите, какие мотивы (паттерны и профили) Prosite находятся в каждом из них: как они называются, какого типа (паттерн или профиль), координаты в последовательности. Хотя бы для одного из белков: в Jalview на выравнивании белка с его гомологами для каждой найденной записи Prosite выделите соответствующиий участок своего белка и всё, что с ним выравнивается, и назовите получившуюся группу идентификатором банка Prosite.
Указания. На http://prosite.expasy.org/ помещаете в окошко "Quick Scan mode of ScanProsite" последовательность или AC белка. Чтобы завести в Jalview "группу" и дать ей название: выделяете мышью прямоугольник на выравнивании, щёлкаете по нему правой кнопкой мыши, выбираете Selection → Group → Edit name ... . При ошибке: чтобы отменить выделение, нажмите клавишу Esc, чтобы уничтожить все группы – <Ctrl+U>.
Для тех же белков определите, какие эволюционные домены банка Pfam в них находятся: приведите их AC (начинаются с "PF"), названия и координаты в последовательности.