и его применение в биоинформатике
Лекция 5
Анна Валяева
29 сентября 2025
Данные из пакета {palmerpenguins}.
Artwork by @allison_horst
# A tibble: 344 × 8
species island bill_length_mm bill_depth_mm flipper_length_mm body_mass_g
<chr> <chr> <dbl> <dbl> <dbl> <dbl>
1 Adelie Torgersen 39.1 18.7 181 3750
2 Adelie Torgersen 39.5 17.4 186 3800
3 Adelie Torgersen 40.3 18 195 3250
4 Adelie Torgersen NA NA NA NA
5 Adelie Torgersen 36.7 19.3 193 3450
6 Adelie Torgersen 39.3 20.6 190 3650
7 Adelie Torgersen 38.9 17.8 181 3625
8 Adelie Torgersen 39.2 19.6 195 4675
9 Adelie Torgersen 34.1 18.1 193 3475
10 Adelie Torgersen 42 20.2 190 4250
# ℹ 334 more rows
# ℹ 2 more variables: sex <chr>, year <dbl>
Гистограмма
Столбчатая диаграмма
Число бинов - 5
Число бинов - 50
Показывает статистики распределения:
Q1 - 1.5 × IQRQ3 + 1.5 × IQRМожет быть по-разному в зависимости от используемого инструмента.
+# ОБЯЗАТЕЛЬНОЕ
ggplot(
data = <DATA>, # данные
mapping = aes(<MAPPINGS>)) + # переменные по осям X, Y, цвет...
<GEOM_FUNCTION>() + # тип графика
# ДОПОЛНИТЕЛЬНОЕ
<SCALE_FUNCTION>() + # трансформация осей
<COORDINATE_FUNCTION>() + # настройка системы координат
<FACET_FUNCTION>() + # разделение графика на панель
<THEME_FUNCTION>() # настройка оформления графикаВ ggplot2 есть несколько встроенных тем для оформления графика:
theme_grey() - стандартная серая темаtheme_bw()theme_classic()theme_void()aesscale_color_manual()Цвета можно задать с помощью:
colors()colors()[573]rgb()
rgb(244/255, 164/255, 96/255)colors()Показаны первые 125 цветов из 657.
Давайте посмотрим на встроенный датасет msleep.
Что он содержит?
Подробную информацию о датасете можно получить в справке: ?msleep.
aes - aestheticsДля разных geom_ функциий набор доступных aes разный.
Для geom_point():
shape - тип символаcolor - цвет общий / цвет обводкиfill - заливкаsize - размерstroke - толщина обводкиalpha - прозрачностьaes переменные - из разных столбцовИ color, и fill для обводки и заливки.
Задать цвет вручную - scale_color_manual() или scale_fill_manual().
theme() 🏠element_text()theme() 🏠element_line()theme() 🏠element_rect()После записи в файл, проверяйте, что все сохранилось правильно. Например, размеры итоговой картинки (height и width) могут не подходить для вашего графика - все либо будет слишком мелко, либо элементы будут наезжать друг на друга.
Если не указать plot = p, то будет сохранен последний нарисованный/выведенный в консоль график.
Более универсальный вариант:
Либо сохраняйте вручную из RStudio.
В панели Plots: Export -> Save as…
geom_point()geom_line()geom_histogram()geom_boxplot()geom_bar() и geom_col()geom_text() и geom_label()geom_histogram()x - количественный признак, распределение которого изучаемfill (или color) можно разделить гистограмму по значениям категориальной переменной на несколько на одном графикеgeom_boxplot()x - значения категориальной переменнойy - количественный признак, распределение которого изучаемfill (или color) можно “разбить” ящики с усами по значениям второй категориальной переменнойДавайте опишем всех животных из датасета msleep с точки зрения их веса.