Задания по теме лекции 3
Отчет о выполненных заданиях присылайте А.Алексеевскому в файлах из Word или аналогичной программы на адрес aba@belozersky.msu.ru. Студенты, написавшие программу(задание 2), я думаю, сумею ее переслать для проверки
Для зачета темы достаточно выполнить одно из заданий.
Отчет должен содержать короткий текст с объяснениями и вашими комментариями.
Коллеги! Задание 1 имеет отношение к вопросу о существовании общего предка всего живого на Земле - LUCA (Last Universal Common Ancestor). Можно безоговорочно верить науке, но тогда приходится в равной степени доверять тому, что пишет или вещает с экрана телевизора каждый доктор наук: чёрным дырам; передаче мыслей на расстояние; существованию LUCA; тому, что ГМО вредно для всего живого; тому, что у одного из видов обезьян самцы различают только два цвета, а самки - три, как люди; и т.д., и т.п. Среди приведенных высказываний есть правильные и ложные. Какие правильные? Можно хотя бы частично проверять аргументы, выдвинутые авторами. Здесь я предоставляю вам такую возможность. Приведите, если сможете, аргументы или контраргументы к тому, что построенное вами выравнивание свидетельствует в пользу существования LUCA! ААл
Задание 1. Обоснуйте или отвегните гомологичность белков DnaK из всех царств
DnaK - белок теплового шока. Не во всех организмах он называется так, для биологии множественность названий примерно одного и того же типична. DnaK принадлежит семейству HSP70 (Heat Shoсk Proteins) Белки этого семейства способствуют правильному сворачиванию других белков в разных условиях. Полипептидная (белковая) цепь должна свернуться в пространстве в уникальную пространственную структуру. Некоторым белкам нужна помощь других белков в том, чтобы свернуться правильно.
Результат представьте в протоколе (Word'овский файл с картинкой)
Как действовать.
- Возьмите последовательности белков теплового шока из семейства HSP70 (Heat Shoсk Proteins) из самых разных организмов.
человеческий белок Homo sapiens (P0DMV8)
белок из плодовой мушки Drosophila melanogaster (P29843)
белок из пекарских дрожжей Saccharomyces cerevisiae (P09435)
белок из резушки Таля (растение) Arabidopsis thaliana (Q9LHA8)
белок из кишечной палочки Escherichia coli (P0A6Y8)
белок из сенной палочки (бактерия) Bacillus subtilis (P17820)
белок из археи (прокариоты) Natrinema pellirubrum (L0JMZ7)
белок из археи живущей в соленых озерах штата Юта, США (прокариоты) Methanohalophilus mahii (D5E7H4)
(в скобках указан идентификатор последовательности в базе белковых последовательностей Uniprot)
- Постройте множественное выравнивание последовательностей этих белков семейства HSP70
для этого надо открыть страницу Uniprot (http://www.uniprot.org),
- выбрать для поиска последовательностей UniprotKB
- составить и поместить в окно запроса выражение вида: id:P0DMV8 OR id:P29843 OR и так далее, перечислив все идентификаторы
- Search и проверьте, что найдены все последовательности
Можете добавить еще несколько на своё усмотрение поиском по базе данных Uniprot (как - см. ниже). ЭТО ЗАДАНИЕ ДЕЛАТЬ НЕ ОБЯЗАТЕЛЬНО
- отметьте галочками(слева) все последовательности
- нажмите кнопку Align
- когда появится выравнивание попробуйте разные раскраски (галочки слева): в итоге то, что нам нужно - раскраска similarity - по сходству аминокислотных остатков
- Посчитайте число и процент абсолютно консервативных колонок (в колонке одна буква во всех последовательностях) и функционально консервативных колонок (к консервативным добавятся колонки в которых буквы разные, но остатки сходные по свойствам, ":" под колонкой) во всем выравнивании или его части - если это важно для ваших выводов.
- Напишите свое объяснение увиденного. Помните: выбранные организмы разделяют миллиарды лет раздельной эволюции!
- Скопируйте в протокол картинку с частью выравнивания (все выравнивание не помещается), которая подтвердит ваши выводы.
Можно нажать клавишу PrintScreen (PrtScr), вставить снимок экрана в графический редактор и вырезать нужную часть.
- Напишите выводы о том, как могли возникнуть белки с настолько похожими последовательностями.
- Также приветствуются любые ваши наблюдения о выравнивании и вопросы.
Поиск новых членов семейства HSP70 в других организмах. В Uniprot откройте список предложенных белков.Отметьте галочкой один из них. Нажмите BLAST (поиск белков с последовательностью, похожей на последовательность входного белка), выберите Advanced. Выберите в каких выборках из базы данных искать. (Можно выбрать Uniprot/swissprot - поиск среди лучше изученных белков). В окошке hits укажите 1000 как ограничение на число находок. А из них выберите потом 2-5 из понятных вам организмов. В таблице находок можно добавлять и убирать колонки (кнопка columns).
Вариант работы с выравниванием.
Установите программу JalView (адрес найдете поиском)
- Сохраните выравнивание в формате fasta - на странице Uniprot есть такая возможность
Откройте в JalView (Inport Alignment => From file) и поиграйте с его возможностями; прежде всего, меню Color: Clustalx и By conservation; есть Export картинки.
Задание 2. Выполните '''одно из''' перечисленных ниже заданий
1.(для мех-мата)Написать формулу для числа разных выравниваний двух последовательностей длины n и m. Сколько выравниваний двух последовательностей длины 1000 существует?
2.(для ВМК) Написать программу для построения оптимального (самого лучшего) выравнивания двух данных последовательностей. См. презентацию.
3.(для знающих русский язык) Придумать вес выравнивания двух фраз (например, в программе антиплагиат)
4. Придумать или найти в литературе и интернете другие задачи, решаемые тем же методом – динамическим программированием
Конечно, слушатель может выбрать любой из предложенных вариантов задания вне зависимости от своей специализации
Fasta формат для последовательностей. Пример:
>sp|P29843|HSP7A_DROME Heat shock 70 kDa protein OS=Drosophila melanogaster OX=7227 GN=Hsc70-1 PE=1 SV=1 MPKLPAVGIDLGTTYSCVGVFQHGKVEIIANDQGNRTTPSYVAFTESERLIGDAAKNQVA MNPNNTIFDAKRLIGRRFDDATVQSDMKHWPFEVFAENGKPRIRVEYKGERKSFYPEEVS SMVLTKMRETAEAYLGGTVTDAVVTVPAYFNDSQRQATKDAGAIAGLNVLRIINEPTAAA
sp||P29843|HSP7A_DROME - текст до 1го пробела - идентификатор последовательности. В примере их даже два: sp - указание на то, что из БД Uniprot/Swissprot; P29843 - идентификатор, называемый код доступа (AC - accession number); HSP7A_DROME - идентификатор, HSP7A - код названия белка, DROME - код организма ( Drosophila melanogaster)
Текст после пробела до конца строки - произвольное описание белка
Все остальные строки - последовательность. Число букв в строке не оговорено, может быть любым. Пробелы игнорируются.
Задание 1b Бывают ли у вирусов белки семейства HSP70
Указания.
- Используйте BLAST, см. указание к заданию 1.
- Добавьте одну или несколько найденных последовательность к выравниванию
- на странице Uniprot с выравниванием есть такая возможность
- Опишите в протоколе на какую из последовательностей больше похожа вирусная. Приведите фрагмент выравнивания.
е из Word или аналогичной программы на адрес aba@belozersky.msu.ru.
Выполнение (элементарного) задания 0 обязательно для зачёта по теме 2.
Зачет темы - при выполнении еще одного из заданий.