Учебная страница курса биоинформатики,
год поступления 2011
Занятие 5. Выравнивание последовательностей
Ваша рабочая директория — H:\Term2\Block2\Practice5.
Результаты следует представить на html странице своего сайта
Обязательные задания
1. Постройте вручную выравнивание фрагментов последовательности двух родственных белков
Скопируйте пару коротких последовательностей из таблицы (против своего имени) в файл shortseqs.fasta. Последовательности должны быть в fasta-формате
Запустите программу GeneDoc и импортируйте этот файл (см. подсказки).
- Выровняйте последовательности, стараясь, чтобы было сопоставлено максимальное число одинаковых букв.
Аминокислотные остатки считаются сопоставленными, если соответствующие им буквы стоят в одной колонке. Если нет возможности сопоставить одинаковые буквы то старайтесь сопоставить буквы, отвечающие похожим по свойствам остаткам.
Сохраните выравнивание под именем alignment1.msf. В отчёт вставьте изображение выравнивания и ссылку на него. Посчитайте и приведите в отчёте процент идентичности и процент сходства двух последовательностей.
Пояснение. Процентом идентичности считается процент колонок, в которых стоят одинаковые буквы, к общему числу колонок выравнивания. Колонки, содержащие только символы разрыва ("гэпа") не учитываются; колонки, в которых есть и буквы, и символы разрыва, учитываются. Процентом сходства считается процент колонок либо с одинаковыми буквами, либо с буквами, отвечающими похожим остаткам. Сходными остатками считаются такие, для которых значение элемента матрицы сходства BLOSUM62 положительно.
(NB. Матрицы сходства бывают разные)
2. Пользуясь возможностями Excel постройте карту локального сходства последовательностей из задания 1
- Пример результата - Excel-таблица для последовательностей AGWKG и GLWK:
|
A |
G |
W |
K |
G |
G |
|
1 |
|
|
1 |
L |
|
|
|
|
|
W |
|
|
1 |
|
|
K |
|
|
|
1 |
|
- Для введения последовательностей по букве в ячейке лучше написать формулу (оценивается выше), см. семестр 1.
- Для отметки совпадающих букв числом "1" тоже лучше написать формулу, используя функции IF и AND.
- Закрасьте цветом ячейки, которые образуют путь, сответствующий оптимальному, на Ваш взгляд, выравниванию.
- В отчёте на HTML странице поставьте ссылку на файл Excel а также опишите соответствие между путем на карте и выравниванием (чему в выравнивании соответствуют разные виды перехода от клетки к следующей в отмеченном вами пути).
3. Пользуясь программой bl2seq выровняйте первый фрагмент из задания 1 с последовательностью вашего белка
- Первый фрагмент представляет собой фрагмент последовательности вашего белка.
Программа bl2seq строит частичные выравнивания; ее следует применять для выравнивания одинаковых или очень сходных последовательностей.
bl2seq стоит на kodomo и реализована как сервис на сайтеNCBI BLAST. В этом задании познакомьтесь с сервисом.
найдите внизу страницы гиперссылку Align и перейдите по ней
выберите вкладку blastp (это вариант для выравнивания белковых последовательностей)
- определите с помощью этого сервиса координаты (начало и конец) последовательности фрагмента в полной последовательности белка; занесите ответ в отчет
- сохраните и присоедините к отчёту выравнивание, которое строит сервис bl2seq
4. Пользуясь сервисом bl2seq выровняйте последовательность вашего белка с последовательностью гомологичного (родственного) белка
UniProt ID гомолога см. в таблице.
- Укажите в отчёте: ID белков, из каких организмов белки, проценты идентичности ("Identities") и сходства ("Positives"), число символов разрыва (гэпов) и число разрывов - идущих подряд символов разрыва, в каждой из последовательностей, суммарное число гэповых колонок, координаты выровненного участка (участков, если выдано несколько выравниваний) в обеих последовательностях.
- Сохраните карту локального сходства в виде gif-файла; желательно, чтобы в имени файла фигурировали идентификаторы последовательностей.
Cм. указания