Учебная страница курса биоинформатики,
год поступления 2015
Упражнения
Данные для упражнений лежат здесь. Поддиректории названны номером упражнения. Можно брать любой из файлов, если их несколько.
1. Вычислительные формулы
(простое) Вычислите сумму первых 100 чисел Фибоначчи: F0 = 0, F1 = 1, Fn = Fn–1 + Fn–2 при n > 1.
(посложнее) Постройте график функции Acos(2πnx + φ)
на отрезке [0;10] с интервалом 0,01. Объясните как меняется график при изменении параметров A, n, φ; здесь n — целое, A и φ — любые действительные.
2. Работа с текстами
(простое) Дан файл с идентификаторами участков последовательностей белков (доменов — для тех, кто знает это слово). Создайте таблицу с четырьмя колонками: идентификатор всего белка (имеет вид XXXX_YYYYY), начало участка, конец участка, длина участка.
- (посложнее) Дан файл с последовательностью ДНК. Создайте таблицу с одной колонкой — последовательностью, записанной сверху вниз.
3. Ссылки
Дан файл с последовательностью ДНК, записанной в один столбец. Составьте таблицу встречаемости нуклеотидов A, T, G, C в ней. Первая колонка – нуклеотид, вторая – число встреч, третья – процент от общего числа нуклеотидов.
Дан файл с последовательностью белка, записанной в один столбец (возьмите свой белок). Составьте таблицу встречаемости 20-и аминокислотных остатков – аналогично предыдущему заданию.
4. Статистические
(простое) Дан файл с набором длин последовательностей всех изоформ белков человека (с одного гена может экспрессироваться, т.е. производится, несколько изоформ белка в результате альтернативного сплайсинга). Рассчитайте среднюю длину, стандартное отклонение – характеристику разброса данных, медиану, минимальное и максимальное значение.
5. Логические
Даны координаты генов в геноме в формате: первая колонка – первый нуклеотид старт-кодона, вторая колонка – последний нуклеотид стоп-кодона. Добавьте колонку "ориентация гена": 1, если он закодирован на прямой цепи, –1, если на обратной.
6. ВПР — вертикальный просмотр
- Дана последовательность белка в трехбуквенном коде. Создайте последовательность в однобуквенном коде, пользуясь таблицей перекодировки.
Упражнения
Создайте файл XXXXXXX_pr14_ex.xlsx, XXXXXXX - ваша фамилия латинскими буквами. Каждое упражнение выполняйте на отдельной странице. Страницы переименуйте в ex1, ex2 и т.д.(ex - от exercise)
Для проверки следует поставить ссылку на этот файл с новой веб-страницы Excel.
На основе данных со страницы side_info ведомости создайте плоскую таблицу с колонками:
используйте команду vlookup (ВПР) для перенесения данных из второй таблицы на этой странице; см. 3й рисунок: яблоки заменить на пользовательское имя, цену - на число голосований и все получится!
(*) Файл enzymes.txt содержит сведения о ферментах из систем рестрикции-модификации в геномах бактерий и архей. Создайте сводную таблицу у которой строчки - штаммы бактерий, столбцы - типы ферментов, ячейки содержат число таких ферментов.
Способ 1: с помощью функции countifs()
В колонку A начиная от A2 поместите список штаммов без повторений!
меню Data => Remove duplicates
см. также http://www.planetaexcel.ru/techniques/14/103/
В строку 1, начиная с колонки B поместите список значений в колонке Enzyme
курсор - на ячейкe B1 => правая кнопка мыши => Paste special (специальная вставка) => поставьте галочку transpose (транспонировать) - в нижнем правом углу => Ok
Способ 2: с помощью мастера таблиц
нажмите на круг справа сверху, где сохранение и т.п. => параметры => надстройка => Управление: Надстройки Excel => Перейти => проверьте наличие галочки против Пакета анализа
Меню Вставка => Сводная таблица => На новый лист; появится окошко как здесь http://www.planetaexcel.ru/techniques/8/130/