Упражнения
Данные для упражнений лежат здесь. Поддиректории названны номером упражнения. Можно брать любой из файлов, если их несколько.
1. Вычислительные формулы
(простое) Вычислите сумму первых 100 чисел Фибоначчи: F0 = 0, F1 = 1, Fn = Fn–1 + Fn–2 при n > 1.
(посложнее) Постройте график функции Acos(2πnx + φ)
на отрезке [0;10] с интервалом 0,01. Объясните как меняется график при изменении параметров A, n, φ; здесь n — целое, A и φ — любые действительные.
2. Работа с текстами
(простое) Дан файл с идентификаторами участков последовательностей белков (доменов — для тех, кто знает это слово). Создайте таблицу с четырьмя колонками: идентификатор всего белка (имеет вид XXXX_YYYYY), начало участка, конец участка, длина участка.
- (посложнее) Дан файл с последовательностью ДНК. Создайте таблицу с одной колонкой — последовательностью, записанной сверху вниз.
3. Ссылки
Дан файл с последовательностью ДНК, записанной в один столбец. Составьте таблицу встречаемости нуклеотидов A, T, G, C в ней. Первая колонка – нуклеотид, вторая – число встреч, третья – процент от общего числа нуклеотидов.
Дан файл с последовательностью белка, записанной в один столбец (возьмите свой белок). Составьте таблицу встречаемости 20-и аминокислотных остатков – аналогично предыдущему заданию.
4. Статистические
(простое) Дан файл с набором длин последовательностей всех изоформ белков человека (с одного гена может экспрессироваться, т.е. производится, несколько изоформ белка в результате альтернативного сплайсинга). Рассчитайте среднюю длину, стандартное отклонение – характеристику разброса данных, медиану, минимальное и максимальное значение.
5. Логические
Даны координаты генов в геноме в формате: первая колонка – первый нуклеотид старт-кодона, вторая колонка – последний нуклеотид стоп-кодона. Добавьте колонку "ориентация гена": 1, если он закодирован на прямой цепи, –1, если на обратной.
6. ВПР — вертикальный просмотр
- Дана последовательность белка в трехбуквенном коде. Создайте последовательность в однобуквенном коде, пользуясь таблицей перекодировки.
Упражнения
Создайте файл XXXXXXX_pr14_ex.xlsx, XXXXXXX - ваша фамилия латинскими буквами. Каждое упражнение выполняйте на отдельной странице. Страницы переименуйте в ex1, ex2 и т.д.(ex - от exercise)
Для проверки следует поставить ссылку на этот файл с новой веб-страницы Excel.
На основе данных со страницы side_info ведомости создайте плоскую таблицу с колонками:
используйте команду vlookup (ВПР) для перенесения данных из второй таблицы на этой странице; см. 3й рисунок: яблоки заменить на пользовательское имя, цену - на число голосований и все получится!
(*) Файл enzymes.txt содержит сведения о ферментах из систем рестрикции-модификации в геномах бактерий и архей. Создайте сводную таблицу у которой строчки - штаммы бактерий, столбцы - типы ферментов, ячейки содержат число таких ферментов.
Способ 1: с помощью функции countifs()
В колонку A начиная от A2 поместите список штаммов без повторений!
меню Data => Remove duplicates
см. также http://www.planetaexcel.ru/techniques/14/103/
В строку 1, начиная с колонки B поместите список значений в колонке Enzyme
курсор - на ячейкe B1 => правая кнопка мыши => Paste special (специальная вставка) => поставьте галочку transpose (транспонировать) - в нижнем правом углу => Ok
Способ 2: с помощью мастера таблиц
нажмите на круг справа сверху, где сохранение и т.п. => параметры => надстройка => Управление: Надстройки Excel => Перейти => проверьте наличие галочки против Пакета анализа
Меню Вставка => Сводная таблица => На новый лист; появится окошко как здесь http://www.planetaexcel.ru/techniques/8/130/