Дедлайн: 20 декабря 23:59

15 декабря будет контрольная работа, ОЧЕНЬ похожая на это домашнее задание.

Во всех заданиях не забывайте формулировать нулевую и альтернативную гипотезы, уровень значимости, выводить p-value и делать выводы.

Задание №1

Выберите свою любую любимую картинку в рамках приличия.

Используя пакет hexSticker, нарисуйте шестиугольный логотип

Задание №2

Воспользуйтесь данными mtcars.

Каждая из 32 машин охарактеризована 11ю показателями.

  1. Скоррелируйте показатели машин друг с другом. Выделите высокоскоррелированные показатели: коэффициент корреляции Спирмена > 0.8 без учета значимости. Оставьте только такие показатели, которые не являются высокоскоррелированными между собой согласно вышеописанным критериям (из группы должен остаться любой один).

  2. Визуализируйте кореляционные матрицы до и после фильтрации так, чтобы были видны в явном виде значения коэффициентов корреляции.

(3*) Выделите на рисунке, построенном по исходной матрице корреляций, значения, которые подлежат фильтрации.

  1. На основании оставшихся показателей скоррелируйте машины друг с другом. Визуализируйте получившуюся корреляционную матрицу, указав только значимые коэффициенты корреляции любым способом (звездочки, значения коэффициентов корреляции, цвет или что-то другое на ваш вкус).

  2. Измените палитру на любую НЕ красно-синюю.

Задание №3

Для каждого численного параметра из данных про ирисы (iris) (должно получиться 4 параметра) нарисуйте график, состоящий из двух графиков, расположенных рядом: qqplot и гистограмма (на гистограме подписаны текстом значения асимметрии и эксцесса).

В итоге должно получиться 4 графика, каждый из которых составлен из двух графиков.

Подпишите все оси, графики, название параметров и пр.

Задание №4

Воспользуйтесь данными mice из пакета datarium.

Узнайте, отличается ли средний вес мышей от 25г?

Не забудьте сформулировать нулевую и альтернативную гипотезы, задать уровень значимости, вывести и p-value и сделать вывод.

Задание №5

Сформулируйте задачу №4 так, чтобы выяснить в какую сторону от 25г в среднем отличается вес мышей из предложенной выборки.

Задание №6

Воспользуйтесь набором данных genderweight из пакета datarium.

Различается ли в среднем вес мужчин и женщин из предложенной выборки?

Объясните выбор теста, сформулируйте необходимые нулевую и альтернативную гипотезы.

Визуализируйте результаты наиболее наглядным образом.

Задание №7

Воспользуйтесь набором данных mices2 из пакета datarium.

Изменился ли в среднем вес мышей после воздействия?

Если изменился, то уменьшился или увеличился?

Задание №8

Воспользуйтесь набором данных о звездных войнах.

Разделите персонажей на высоких (рост (height) > 180) и невысоких (рост <= 180).

Связаны ли рост и гендер (gender) персонажей?

Задание №9

Воспользуйтесь данными из таблицы pois.tsv

Различается ли в среднем время (time) между группами poison? Воспользуйтесь ANOVA.

Если различается, то между какими конкретно группами?

Задание №10

Воспользуйтесь данными из таблицы pois.tsv

Различаются ли в среднем времена отклика между каждой группой по столбцу treat? Проведите необходимое количество сравнений.

Для решения воспользуйтесь непараметрическим тестом. Укажите допущения, если необходимо.

Создайте таблицу, где в строках будут указаны пары сравниваемых групп, для каждого сравнения укажите p-value.

С помощью функции p.adj дополните таблицу поправленными p-value, используйте два любых разных способа поправки, принадлежащих к разным классам (FDR, FWER).

Нарисуйте диаграмму рассеяния, где по осям будут отложены значения поправленных p-value для одного из методов.

Сделайте вывод о том, какой из методов “строже” и почему.


Помните, что контрольная будет ОЧЕНЬ похожа на это ДЗ?