Учебная страница курса биоинформатики,
год поступления 2012
Дополнительная информация к практикуму
1. Реконструкция матрицы BLOSUM
Импортируйте табличку частот fij с количеством пар в Excel. Лучше сразу, чтобы не путаться потом, отсортировать таблицу так, как требуется для дальнейшей работы. Чтобы не делать это вручную, советую скопировать Таблицу 1 из основного задания в Excel и отсортировать полученные 2 колонки (номер и букву аминокислоты) по алфавиту буквы. Тогда, очевидно, значения второй колонки (буквы аминокислот) будут совпадать с буквами, которые есть в таблице. Удалите повторяющийся столбец, а затем выделите все строчки таблицы и отсортируйте по номерам, оставшимся от "правильного" порядка. Обратите внимание, что теперь у вас потерялась симметричность матрицы: надо ее восстановить. Для этого сперва транспонируйте матрицу (выделите все клетки со значениями, скопируйте в буфер обмена, а потом вставьте через "Специальную вставку", пометив галочкой "транспонировать" ("transpose")), а потом повторите с транспонированной матрицей сортировку по столбцам.
Убедитесь, что матрица снова стала симметричной, и что все осталось правильно: наугад выберите любую клетку и проверьте, соответствует ли находящееся в ней число исходному.
Формула для наблюдаемых вероятностей пар qij: прежде чем считать матрицу qij, вычислите сумму из знаменателя. Обратите внимание на пределы суммирования; нужная сумма не будет просто суммой всех величин в таблице! Рассчитайте матрицу qij, пользуясь где нужно значком $ в формуле. Если вы все делаете правильно, то таблица получается применением всего одной формулы.
Формула для наблюдаемых вероятностей отдельных аминокислот pi: лучше воспользоваться нижней формулой из презентации, так как это проще посчитать в excel. Величины pi у вас будут не матрицей, а вектором. Вычислите значения вектора (я не нашла способа сделать это в одну формулу - видимо, придется менять координаты ячейки на главной диагонали вручную...)
Формула для ожидаемых вероятностей пар eij: вставьте вектор pi в виде строки и столбца (транспонировав его) вверху и слева от пустой таблицы - не забудьте использовать вставку "Только значений" через меню "Специальная вставка", иначе числа поплывут! Заполните всю таблицу вычислением по формуле для i не равного j, а потом поменяйте формулу для ячеек главной диагонали.