Дедлайн: 20 декабря 23:59
15 декабря будет контрольная работа, ОЧЕНЬ похожая на это домашнее задание.
Во всех заданиях не забывайте формулировать нулевую и альтернативную гипотезы, уровень значимости, выводить p-value и делать выводы.
Выберите свою любую любимую картинку в рамках приличия.
Используя пакет hexSticker
, нарисуйте шестиугольный
логотип
Воспользуйтесь данными mtcars.
Каждая из 32 машин охарактеризована 11ю показателями.
Скоррелируйте показатели машин друг с другом. Выделите высокоскоррелированные показатели: коэффициент корреляции Спирмена > 0.8 без учета значимости. Оставьте только такие показатели, которые не являются высокоскоррелированными между собой согласно вышеописанным критериям (из группы должен остаться любой один).
Визуализируйте кореляционные матрицы до и после фильтрации так, чтобы были видны в явном виде значения коэффициентов корреляции.
(3*) Выделите на рисунке, построенном по исходной матрице корреляций, значения, которые подлежат фильтрации.
На основании оставшихся показателей скоррелируйте машины друг с другом. Визуализируйте получившуюся корреляционную матрицу, указав только значимые коэффициенты корреляции любым способом (звездочки, значения коэффициентов корреляции, цвет или что-то другое на ваш вкус).
Измените палитру на любую НЕ красно-синюю.
Для каждого численного параметра из данных про ирисы (iris) (должно получиться 4 параметра) нарисуйте график, состоящий из двух графиков, расположенных рядом: qqplot и гистограмма (на гистограме подписаны текстом значения асимметрии и эксцесса).
В итоге должно получиться 4 графика, каждый из которых составлен из двух графиков.
Подпишите все оси, графики, название параметров и пр.
Воспользуйтесь данными mice из пакета datarium.
Узнайте, отличается ли средний вес мышей от 25г?
Не забудьте сформулировать нулевую и альтернативную гипотезы, задать уровень значимости, вывести и p-value и сделать вывод.
Сформулируйте задачу №4 так, чтобы выяснить в какую сторону от 25г в среднем отличается вес мышей из предложенной выборки.
Воспользуйтесь набором данных genderweight из пакета datarium.
Различается ли в среднем вес мужчин и женщин из предложенной выборки?
Объясните выбор теста, сформулируйте необходимые нулевую и альтернативную гипотезы.
Визуализируйте результаты наиболее наглядным образом.
Воспользуйтесь набором данных mices2 из пакета datarium.
Изменился ли в среднем вес мышей после воздействия?
Если изменился, то уменьшился или увеличился?
Воспользуйтесь набором данных о звездных войнах.
Разделите персонажей на высоких (рост (height) > 180) и невысоких (рост <= 180).
Связаны ли рост и гендер (gender) персонажей?
Воспользуйтесь данными из таблицы pois.tsv
Различается ли в среднем время (time) между группами poison? Воспользуйтесь ANOVA.
Если различается, то между какими конкретно группами?
Воспользуйтесь данными из таблицы pois.tsv
Различаются ли в среднем времена отклика между каждой группой по столбцу treat? Проведите необходимое количество сравнений.
Для решения воспользуйтесь непараметрическим тестом. Укажите допущения, если необходимо.
Создайте таблицу, где в строках будут указаны пары сравниваемых групп, для каждого сравнения укажите p-value.
С помощью функции p.adj дополните таблицу поправленными p-value, используйте два любых разных способа поправки, принадлежащих к разным классам (FDR, FWER).
Нарисуйте диаграмму рассеяния, где по осям будут отложены значения поправленных p-value для одного из методов.
Сделайте вывод о том, какой из методов “строже” и почему.
Помните, что контрольная будет ОЧЕНЬ похожа на это ДЗ?