Занятие 4. Выравнивание последовательностей

Ваша рабочая директория — H:\Term2\Practice4.
Отчет нужно оформить в виде HTML-странички к следующему занятию.

Обязательные задания

Определить положение фрагмента в полной последовательности
В таблице против своей фамилии найдите 2 коротких фрагмента, первый из них – это фрагмент последовательности заданного белка. Создайте с помощью FAR Manager текстовой файл fullANDpart.fasta, в нем сохраните в формате FASTA первый фрагмент, а также полную последовательность заданного вам белка.
Запустите программу GeneDoc и импортируйте полученный файл (см. подсказки к GeneDoc). Двигая фрагмент относительно полной последовательности, добейтесь полного совпадения букв. Определите номера позиций в полной последовательности, которым соответствуют первый и последний а.о. заданного фрагмента.

Подсказка. Если подвести курсор к букве, то справа на нижней планке окна GeneDoc появится номер а.о. в данной последовательности .

Сохраните выравнивание под именем alignment1.msf в рабочей директории.
- Запишите в протокол: "заданный фрагмент соответствует позициям xxx–yyyy в полной последовательности белка хххх_Ecoli".
- Получите картинку с этим выравниванием (см. подсказки). Cохраните ее в файле aln1.gif в рабочей директории.
Построить "наилучшее" выравнивание вручную
Скопируйте обе короткие последовательностей из таблицы в файл "shortseqs.fasta". Запустите программу GeneDoc (или откройте в ней новое окно) и импортируйте этот файл (см. подсказки). Выровняйте последовательности, стараясь, чтобы было сопоставлено максимальное число одинаковых букв при минимальном числе пропусков.

Указание. Будем считать одним пропуском непрерывную последовательность символов "–" любой длины. Для получения "наилучшего" выравнивания будем оценивать его вес как:

W = M – nG
где M — число совпавших букв, G — штраф за пропуск, равен 2, n — общее число пропусков.
Краевые пропуски не штрафуются!!
Длина пропуска не имеет значения.
Чем больше вес, тем лучше выравнивание!
При заданных параметрах можно ожидать, что вес должен быть порядка 5–10.

Сохраните выравнивание под именем alignment2.msf в рабочей директории.
Запишите в протокол:
- исходные длины 2-х заданных фрагментов;
- длину выравнивания (число колонок);
- вес выравнивания;
- процент идентичности двух выровненных последовательностей (отношение числа колонок, в которых стоят одинаковые буквы, к общему числу колонок, включая "гэповые", умноженное на 100).
Получите картинку с этим выравниванием (см. подсказки). Cохраните ее в файле aln2.gif в рабочей директории.
Найти первую с N-конца выравнивания "близкородственную" замену а.о.
Рассмотрите, как устроена наиболее популярная матрица весов замен а.о. BLOSUM62.
Будем считать близкородственными заменами те, для которых значение элемента матрицы положительно.
Внесите в протокол
- № первой позиции выравнивания, в которой мы наблюдаем близкородственную замену а.о;
- полные названия и однобуквенные обозначения поменявшихся а.о;
- вес такой замены в соответствии с использованной матрицей;
- комментарий, в котором попробуйте интерпретировать наблюдаемое с точки зрения физико-химических свойств а.о.
Совет. Для ускорения работы лучше импортировать матрицу в Excel и сразу удалить столбцы и строки, соответствующие символам 'B', 'Z' и 'X' .
С помощью условного форматирования ячеек удобно выделить цветом все элементы матрицы с нужным значением.
Проверьте себя: видите ли вы диагональные элементы матрицы? чем отличаются значения диагональных элементов от других? нужно ли для выполнения упражнения рассматривать всю матрицу, или достаточно только половины, под или над диагональю? После этого можно просто выписать на листок бумаги все нужные замены а.о и сопоставить их с выравниванием.
Оформить протокол в виде HTML-странички
Страничка должна иметь название "Aln1.html". На страничке должен быть заголовок "Пробные выравнивания". Нужно привести 2 картинки, aln1.gif и aln2.gif, а также ответы на все пункты, отмеченные кружком в тексте задания.

Если все обязательные задания сделаны, можете приступать к дополнительным заданиям.

Определить % сходства выровненных фрагментов.
Процентом сходства будем считать отношение числа колонок со сходными буквами к общему числу, умноженное на 100%. Сходными буквами будем считать такие, для которых значение элемента матрицы BLOSUM62 положительно.
Построить иное выравнивание 2-х заданных фрагментом с весом не хуже, чем получилось в обязательном упр.2
Может и не получиться, если вы постарались при выполнении упр.2 ! Тогда представьте вариант выравнивания, не сильно хуже первого.
Придумать, как с помощью функций Excel из матрицы BLOSUM можно получить список замен вида "W-Y вес=...".
К HTML-отчету прикрепить файл Excel, в котором представлен не только результат, но и видны использованные формулы.
Все протоколы добавить на HTML-страничку.

Занятие 4. Выравнивание последовательностей

Ваша рабочая директория — H:\Term2\Practice4. Отчет нужно оформить в виде HTML-странички к следующему занятию.

Обязательные задания

Определить положение фрагмента в полной последовательности

Построить "наилучшее" выравнивание вручную

Найти первую с N-конца выравнивания "близкородственную" замену а.о.

Оформить протокол в виде HTML-странички

Определить % сходства выровненных фрагментов.

Построить иное выравнивание 2-х заданных фрагментом с весом не хуже, чем получилось в обязательном упр.2

Придумать, как с помощью функций Excel из матрицы BLOSUM можно получить список замен вида "W-Y вес=...".

Все протоколы добавить на HTML-страничку.

Ваша рабочая директория — H:\Term2\Practice4.
Отчет нужно оформить в виде HTML-странички к следующему занятию.