#pragma css /css/2021.css <<BI>> = Задания практикума 8 = Срок без потери баллов: 28 октября (включительно). Создайте в Google sheets книгу, которую назовите "Практикум 8" или "Practice 8". Сделайте книгу доступной по ссылке. После выполнения заданий заведите на wiki страницу pr8 и туда поместите краткое описание результатов работы (в частности, какие именно упражнения сделаны из п. 3, как называются листы и прочую справочную информацию) и гиперссылку на книгу. == 1. Создайте гистограмму длин белок-кодирующих участков генома == [[https://kodomo.fbb.msu.ru/wiki/2019/1/histogram|Что такое гистограмма]]. См. также в [[https://en.wikipedia.org/wiki/Histogram|Википедии]]. На первый лист новой книги скопируйте следующие столбцы из листа CDS книги, которую вы создали при выполнении заданий практикума 7: ID, chromosome, start, end, strand, product_accession, name, product_length. Назовите лист "CDS". (Совет: проще сначала скопировать всё содержимое листа, а потом удалить ненужные столбцы. Чтобы удалить столбец, щёлкните по его названию, т.е. букве на сером фоне над содержимым, правой кнопкой мыши и выберите соответствующий пункт в меню). Выберите шаг гистограммы. Он должен быть не слишком мелким (чтобы не было много карманов, в которые попали бы менее 20–25 значений), но и не слишком крупным (чтобы были видны детали распределения длин). Заведите новый лист, назовите его "Histogram". Первый столбец назовите "Length" и заполните его арифметической прогрессией с шагом гистограммы. Второй столбец назовите "Count" и заполните его количествами значений в "product_length", попадающими в соответствующий карман. В качестве последнего кармана имеет смысл использовать, например, интервал 1500–1000000 (смысл этого — "больше 1500", нижнюю границу последнего кармана следует подобрать так, чтобы в него попало не более 10 значений). См. [[../hints8|подсказки]] == 2. Изобразите созданную гистограмму в виде столбчатой диаграммы == См. [[../hints8|подсказки]] == 3. Выполните три любых упражнения из следующего списка == Выполняйте на отдельных листах книги, названия листов должны намекать на содержимое. === График функции, зависящей от параметров === Постройте график функции ''A''cos(2π''nx'' + φ) на отрезке [0;10] по точкам с интервалом 0,01 между последовательными значениями аргумента. Параметры ''A'', ''n'', φ должны лежать в отдельных ячейках так, чтобы их было удобно менять. ''n'' — целое, ''A'' и φ — любые действительные. Убедитесь, что график меняется ожидаемым образом при изменении параметров. === Вычисление приближённого значения интеграла === Даны два столбца, озаглавленные X и Y, оба включают числа, причём значения X упорядочены по возрастанию (таким образом имеется так называемая затабулированная функция). Например, можно взять аргументы и значения из предыдущего упражнения. Написать формулы, позволяющие посчитать приближённое значение интеграла (по отрезку от наименьшего до наибольшего значений X) от этой функции по формуле трапеций. Ячейку, в которой будет получаться значение интеграла, выделите жирным шрифтом и напишите к ней примечание. === Описательная статистика === Рассчитайте среднюю длину, стандартное отклонение (среднее квадратичное отклонений данных от среднего значения), медиану, минимальное и максимальное значения длин продуктов генов (т.е., закодированных в геноме белков), из столбца product_length === Оценка степени случайности различия двух чисел === Посчитайте числа белков, закодированных на двух цепях ДНК в геноме вашей бактерии/археи (в самой большой хромосоме, если хромосом несколько). Посчитайте вероятность получить такое же или большее различие между этими числами при условии заданного общего числа белков. '''Замечание'''. Для мини-обзора генома может быть полезно, помимо этого упражнения как есть, посчитать те же характеристики не по хромосоме целиком, а по "половинкам" каждой хромосомы. Иногда на всей хромосоме достоверного эффекта может не быть, но при этом он может появиться (как разнонаправленный) на половинах. === VLOOKUP === Первый столбец листа озаглавьте Accession и поместите туда 10–20 произвольно выбранных значений из столбца product_accession листа CDS. Второй столбец озаглавьте Name и во второй сверху его ячейке напишите формулу, которая по значению в первой ячейке той же строки определяет name, обращаясь к листу CDS. Распространите формулу на все строки, в которые внесён product_accession. '''Внимание''': обязательно проверить корректность формулы: * при замене содержимого любой ячейки первого столбца на текст, отсутствующий в столбце product_accession листа CDS, во втором столбце должно появляться сообщение об ошибке * если добавить новую строку, внести в её первую ячейку правильный product_accession и скопировать формулу во вторую ячейку, формула должна показать правильное значение name. См. [[../hints8|подсказки]]