Учебная страница курса биоинформатики,
год поступления 2011
Занятие 6. Дополнительные задания
1.
Постройте карту локального сходства двух последовательностей (Вашего белка и его гомолога) с помощью программы dotmatcher пакета EMBOSS. Указание: это программа с графическим выводом. На вопрос "Graph type" следует ответить "ps", затем получившийся файл в формате PostScript можно открыть программой GhostView или импортировать, например, в MS-Word.
2.
Получите несколько субоптимальных локальных выравниваний двух последовательностей (Вашего белка и его гомолога) с помощью программы matcher пакета EMBOSS. Опишите результат.
При выполнении упражнений используйте подсказки EMBOSS
команда -help
3. Найдите вес оптимального выравнивания последовательностей из handout
Матрица весов - BLOSUM62. Штраф за гэп - 4. Специального штрафа за открытие гэпа нет.
Вариант 1 (для терпеливых). Вручную заполните карту оптимальных весов.
Вариант 2 (для знающих Excel).
- Скопируйте BLOSUM62 на лист.
- На новом листе создайте карту сходства последовательностей, заполненную весами из матрица. Используйте команду index(массив, номер строки, номер столбца), выбирающую элемент массива. Номер строки(столбца) для данной буквы можно получить с помощью vlookup (ВПР).
- Создайте карту оптимальных весов. Для этого на новом месте (новом листе) создайте пустую карту; добавьте столбец справа от последовательности и заполните числами, соответствующими штрафам за концевые гэпы; аналогично - строку под горизонтальной последовательностью. Напишите формулу в первой ячейке и распостраните на всю карту. Формула выбирает лучшее из значений веса в зависимости от весов, стоящих в соседних ячейках и веса из карты сходства. См. презентацию. Используйте команду MAX (МАКС)
Вариант 3 (для умеющих программировать). Напишите программу, вычисляющую вес оптимального выравнивания двух последовательностей.
(*) Если написали такую программу, то добавлением нескольких строк кода можно получить и само выравнивание! Для этого на каждом шагу надо дополнительно запоминать переходом из какой ячейки получены наибольшая сумма в данной ячеке и после заполнения всей карты оптимальных весов пройти из последней ячейки по запомненным стрелочкам.