Kodomo

Пользователь

Задания по теме лекции 3

Отчет о выполненных заданиях присылайте А.Алексеевскому в файлах из Word или аналогичной программы на адрес aba@belozersky.msu.ru. Студенты, написавшие программу(задание 2), я думаю, сумею ее переслать для проверки :)

Для зачета темы достаточно выполнить одно из заданий.

Отчет должен содержать короткий текст с объяснениями и вашими комментариями.

Коллеги!

Задание 1 имеет отношение к вопросу о существовании общего предка всего живого на Земле - LUCA (Last Universal Common Ancestor).

Можно безоговорочно верить науке, но тогда приходится в равной степени доверять тому, что пишет или вещает с экрана телевизора каждый доктор наук: чёрным дырам; передаче мыслей на расстояние; существованию LUCA; тому, что ГМО вредно для всего живого; тому, что у одного из видов обезьян самцы различают только два цвета, а самки - три, как люди; и т.д., и т.п.

Среди приведенных высказываний есть правильные и ложные. Какие правильные?

Можно хотя бы частично проверять аргументы, выдвинутые авторами. Здесь я предоставляю вам такую возможность. Приведите, если сможете, аргументы или контраргументы к тому, что построенное вами выравнивание свидетельствует в пользу существования LUCA! 

ААл

Задание 1. Обоснуйте или отвегните гомологичность белков DnaK из всех царств

DnaK - белок теплового шока. Не во всех организмах он называется так, для биологии множественность названий примерно одного и того же типична. DnaK принадлежит семейству HSP70 (Heat Shoсk Proteins) Белки этого семейства способствуют правильному сворачиванию других белков в разных условиях. Полипептидная (белковая) цепь должна свернуться в пространстве в уникальную пространственную структуру. Некоторым белкам нужна помощь других белков в том, чтобы свернуться правильно.

Результат представьте в протоколе (Word'овский файл с картинкой)

Как действовать.

(в скобках указан идентификатор последовательности в базе белковых последовательностей Uniprot)

Поиск новых членов семейства HSP70 в других организмах. В Uniprot откройте список предложенных белков.Отметьте галочкой один из них. Нажмите BLAST (поиск белков с последовательностью, похожей на последовательность входного белка), выберите Advanced. Выберите в каких выборках из базы данных искать. (Можно выбрать Uniprot/swissprot - поиск среди лучше изученных белков). В окошке hits укажите 1000 как ограничение на число находок. А из них выберите потом 2-5 из понятных вам организмов. В таблице находок можно добавлять и убирать колонки (кнопка columns).

Вариант работы с выравниванием.

Задание 2. Выполните '''одно из''' перечисленных ниже заданий

1.(для мех-мата)Написать формулу для числа разных выравниваний двух последовательностей длины n и m. Сколько выравниваний двух последовательностей длины 1000 существует?

2.(для ВМК) Написать программу для построения оптимального (самого лучшего) выравнивания двух данных последовательностей. См. презентацию.

3.(для знающих русский язык) Придумать вес выравнивания двух фраз (например, в программе антиплагиат)

4. Придумать или найти в литературе и интернете другие задачи, решаемые тем же методом – динамическим программированием

Конечно, слушатель может выбрать любой из предложенных вариантов задания вне зависимости от своей специализации

Fasta формат для последовательностей. Пример:

>sp|P29843|HSP7A_DROME Heat shock 70 kDa protein OS=Drosophila melanogaster OX=7227 GN=Hsc70-1 PE=1 SV=1
MPKLPAVGIDLGTTYSCVGVFQHGKVEIIANDQGNRTTPSYVAFTESERLIGDAAKNQVA
MNPNNTIFDAKRLIGRRFDDATVQSDMKHWPFEVFAENGKPRIRVEYKGERKSFYPEEVS
SMVLTKMRETAEAYLGGTVTDAVVTVPAYFNDSQRQATKDAGAIAGLNVLRIINEPTAAA

sp||P29843|HSP7A_DROME - текст до 1го пробела - идентификатор последовательности. В примере их даже два: sp - указание на то, что из БД Uniprot/Swissprot; P29843 - идентификатор, называемый код доступа (AC - accession number); HSP7A_DROME - идентификатор, HSP7A - код названия белка, DROME - код организма ( Drosophila melanogaster)

Текст после пробела до конца строки - произвольное описание белка

Все остальные строки - последовательность. Число букв в строке не оговорено, может быть любым. Пробелы игнорируются.

Задание 1b Бывают ли у вирусов белки семейства HSP70

Указания.