ggplot(penguins, aes(x = species, y = flipper_length_mm, fill = species)) +geom_bar(stat ="summary", fun ="mean") +stat_summary(fun = mean, fun.max =function(x) mean(x) +sd(x),fun.min =function(x) mean(x) -sd(x),geom ="errorbar", width =0.5) ggplot(penguins, aes(x = species, y = flipper_length_mm, fill = species)) +geom_bar(stat ="summary", fun ="mean") +stat_summary(fun = mean, fun.max =function(x) mean(x) +sd(x),fun.min =function(x) mean(x) -sd(x),geom ="errorbar", width =0.5) ggplot(penguins, aes(x = species, y = flipper_length_mm, fill = species)) +geom_bar(stat ="summary", fun ="mean") +stat_summary(fun = mean, fun.max =function(x) mean(x) +sd(x),fun.min =function(x) mean(x) -sd(x),geom ="errorbar", width =0.5)
ggbarplot() из пакета ggpubr
Пакет ggpubr не из коллекции tidyverse, его нужно установить:
install.packages("ggpubr")
library(ggpubr)ggbarplot( penguins, x ="species", y ="flipper_length_mm", fill ="species", add ="mean_sd")library(ggpubr)ggbarplot( penguins, x ="species", y ="flipper_length_mm", fill ="species", add ="mean_sd")
Какой разброс показывать?
SD - стандартное отклонение
SE, или SEM - стандартная ошибка среднего - \(SE = \frac{SD}{\sqrt{n}}\)
CI - доверительный интервал
IQR - интерквартильный размах
…
?ggpubr::ggbarplot
Альтернативы столбчатой диаграммы для количественного признака
Некоторые журналы не рекомендуют использовать столбчатые диаграммы для визуализации выборочных статистик.
малые выборки (\(n<20\)): на столбчатую диаграмму добавляйте точки - индивидуальные наблюдения
большие выборки: используйте ящики с усами, скрипичные диаграммы и их вариации и комбинации
Разделение по двум категориальным переменным
По умолчанию рисуется стековая столбчатая диаграмма - используется параметр position = "stack".
ggplot(penguins, aes(x = species, fill = sex)) +geom_bar()ggplot(penguins, aes(x = species, fill = sex)) +geom_bar()
Группированная диаграмма
Чтобы получить группированную столбчатую диаграмма, нужно изменить параметр на position = "dodge".
ggplot(penguins, aes(x = species, fill = sex)) +geom_bar(position ="dodge")ggplot(penguins, aes(x = species, fill = sex)) +geom_bar(position ="dodge")
Столбчатая диаграмма с процентами
Чтобы вместо числа наблюдений визуализировать процент, нужно изменить параметр position = "fill".
ggplot(penguins, aes(x = species, fill = sex)) +geom_bar(position ="fill")ggplot(penguins, aes(x = species, fill = sex)) +geom_bar(position ="fill")
Изменить порядок столбцов
По умолчанию столбцы располагаются в алфавитном порядке.
ggplot(penguins, aes(x = species, fill = species)) +geom_bar() +theme(legend.position ="none")
Факторы
Категориальные переменные как факторы 🏠
Фактор - fct - особый тип данных в R
Уровни фактора [levels] - ограниченное число известных значений категориальной переменной, отсортированные в определенном порядке