You can not select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

265 lines
8.7KB

  1. ---
  2. title: "ggplot2 avancé"
  3. author: "Antoine Neuraz"
  4. date: "6/5/2019"
  5. output: html_document
  6. ---
  7. # `ggplot2` : techniques avancées
  8. ```{r, include=FALSE}
  9. knitr::opts_chunk$set(echo = TRUE,
  10. fig.pos = "center")
  11. library(tidyverse)
  12. library(ggplot2)
  13. library(see)
  14. library(patchwork)
  15. source('R/util_functions.R')
  16. ```
  17. ## Créer son propre thème `ggplot2`
  18. Les thèmes de `ggplot2` permettent de contrôler l'apparence des plots. Il est possible de modifier un thème standard en utilisant la fonction `theme()`. Mais nous allons voir ici comment créer un thème personalisé.
  19. Il est bien entendu possible de créer un thème de toutes pièces. Pour cela, il faut définir un à un tous les éléments possibles du thème mais c'est très long et rébarbatif. Dans `ggplot2`, le seul thème défini de cette façon est le thème de base `theme_grey()` (voir le [repo officiel](https://github.com/tidyverse/ggplot2/blob/master/R/theme-defaults.r)).
  20. Les autres thèmes héritent les attribut de ce premier thème et modifient uniquement éléments nécéssaires. Par exemple, `theme_bw()` est construit à partir de `theme_grey()` et `theme_minimal()` se base sur `theme_bw()`. C'est beaucoup plus pratique de définir les thèmes de cette façon.
  21. ### un thème est une fonction
  22. Un thème est une fonction R classique qui prend comme arguments 4 variables :
  23. - base_size : taille de base du texte (défaut = 11)
  24. - base_family : famille de polices de base (défaut = "")
  25. - base_line_size : taille de base des éléments `line` (défaut = base_size / 22 )
  26. - base_rect_size : taille de base des éléments `rect` (défault = base_size / 22 )
  27. ```{r, eval = FALSE}
  28. my_theme <- function(base_size = 11,
  29. base_family = "",
  30. base_line_size = base_size / 22,
  31. base_rect_size = base_size / 22) {}
  32. ```
  33. ### modifier un thème de base avec `%+replace%`
  34. Ensuite, nous allons choisir un thème de base duquel notre thème personalisé va hériter les éléments par défaut. En effet, tous les éléments que nous ne spécifieront pas seront basés sur le thème de base. Par exemple, nous pouvons choisir `theme_minimal()`.
  35. Pour modifier les éléments du thème de base, il faut utiliser l'opérateur `%+replace%` suivi de la fonction `theme()`. C'est dans cette dernière que nous pourrons spécifier les différents éléments à modifier par rapport au thème de base.
  36. ```{r, eval = FALSE}
  37. my_theme <- function(base_size = 11,
  38. base_family = "",
  39. base_line_size = base_size / 22,
  40. base_rect_size = base_size / 22) {
  41. theme_minimal(base_size = base_size,
  42. base_family = base_family,
  43. base_line_size = base_line_size,
  44. base_rect_size = base_rect_size) %+replace%
  45. theme(
  46. # éléments à modifier
  47. )
  48. }
  49. ```
  50. ### définir de nouveaux attributs
  51. Nous pouvons a présent inserer dans la fonction thème les éléments à modifier. Notez qu'il ne faut pas utiliser de tailles absolues mais définir des tailles relatives avec la fonction `rel()`.
  52. #### `my_theme()` {-}
  53. Voici un exemple de thème personnalisé (très fortement inspiré du thème `theme_modern()` du package `see`) basé sur `theme_minimal()` :
  54. ```{r, eval = TRUE}
  55. my_theme <- function(base_size = 11,
  56. base_family = "",
  57. base_line_size = base_size / 22,
  58. base_rect_size = base_size / 22) {
  59. half_line <- base_size/2
  60. theme_minimal(base_size = base_size,
  61. base_family = base_family,
  62. base_line_size = base_line_size,
  63. base_rect_size = base_rect_size) %+replace%
  64. theme(
  65. ## Panel grid ##
  66. panel.border = element_blank(),
  67. panel.grid.major = element_blank(),
  68. panel.grid.minor = element_blank(),
  69. ## Title ##
  70. plot.title = element_text(size = rel(1.3),
  71. face = "plain", margin = margin(0, 0, 20, 0)),
  72. ## Axis ##
  73. axis.line = element_line(colour = "black", size = rel(0.5)),
  74. axis.title.y = element_text(margin = margin(t = 0, r = rel(20), b = 0, l = 0),
  75. angle = 90),
  76. axis.title.x = element_text(margin = margin(t = rel(20), r = 0, b = 0, l = 0)),
  77. axis.title = element_text(size = rel(1.2),
  78. face = "plain"),
  79. axis.text = element_text(size = rel(.8)),
  80. axis.ticks = element_blank(),
  81. ## Legend ##
  82. legend.key = element_blank(),
  83. legend.position = "bottom",
  84. legend.text = element_text(size = rel(1.1)),
  85. legend.title = element_text(size = rel(1.1)),
  86. legend.spacing.x = unit(2, "pt"),
  87. ## Background ##
  88. strip.background = element_blank(),
  89. plot.tag = element_text(size = rel(1.3), face = "bold"),
  90. strip.text = element_text(face = "bold")
  91. )
  92. }
  93. ```
  94. #### `my_theme_dark()` {-}
  95. Et un thème sombre basé sur `my_theme()` et très fortement inspiré de `theme_blackboard()` du package `see` :
  96. ```{r}
  97. my_theme_dark <-function(base_size = 11,
  98. base_family = "",
  99. base_line_size = base_size / 22,
  100. base_rect_size = base_size / 22) {
  101. dark_color = "#0d0d0d"
  102. light_color = "#E0E0E0"
  103. my_theme(base_size = base_size,
  104. base_family = base_family,
  105. base_line_size = base_line_size,
  106. base_rect_size = base_rect_size) %+replace%
  107. theme(
  108. ## Backgrounds ##
  109. plot.background = element_rect(fill = dark_color),
  110. panel.background = element_rect(fill = dark_color, color=dark_color),
  111. legend.background = element_rect(fill = dark_color, color=dark_color),
  112. ## Lines ##
  113. axis.line = element_line(color = light_color),
  114. ## Text ##
  115. text = element_text(family = base_family, face = "plain",
  116. color = light_color, size = base_size,
  117. hjust = 0.5, vjust = 0.5, angle = 0,
  118. lineheight =0.9, margin = margin(),
  119. debug = FALSE),
  120. axis.text = element_text(color = light_color)
  121. )
  122. }
  123. ```
  124. ### Exemple
  125. Créons un plot d'exemple à partir d'un jeu de données synthétique
  126. ```{r, echo=TRUE}
  127. p <- generate_uniform_dataset(
  128. dataset_size = 100,
  129. min_x = 0, max_x = 1,
  130. outliers = 2, seed = 506
  131. ) %>%
  132. ggplot(data = ., aes( x = x, y = y, color = group)) +
  133. geom_point(size = 3) +
  134. scale_color_material_d() +
  135. labs(x="legende axe x",
  136. y="legende axe y")
  137. ```
  138. ```{r, echo=TRUE}
  139. p
  140. ```
  141. ```{r, echo=TRUE}
  142. p + theme_minimal() + labs(title= "theme_minimal")
  143. ```
  144. ```{r, echo=TRUE}
  145. p + my_theme() + labs(title= "my_theme")
  146. ```
  147. ```{r,echo=TRUE}
  148. p + my_theme_dark() + labs(title= "my_theme_dark")
  149. ```
  150. ## Utiliser `ggplot2` dans des fonctions
  151. Pour utiliser les syntaxes décrites ici, vous aurez besoin de ggplot2 version >= 3.2.
  152. Prenons l'exemple d'une fonction qui réalise un bar chart (diagramme en barres) pour une colonne données (par exemple `drv`) d'un dataset (par exemple `mpg`, fourni avec `ggplot2`)
  153. Le code pour réaliser ce plot en dehors d'une fonction peut ressembler à ceci :
  154. ```{r}
  155. ggplot(mpg) +
  156. geom_bar(aes(x = drv))
  157. ```
  158. Dans une fonction, nous voudrions pouvoir utiliser un autre dataset et changer le nom de la variable d'intérêt.
  159. Modifier le nom du dataset ne pose pas de problème, et l'on peut utiliser une syntaxe classique :
  160. ```{r, eval = FALSE}
  161. my_bar <- function(df) {
  162. ggplot(df) +
  163. geom_bar(aes(x = drv))
  164. }
  165. my_bar(mpg)
  166. ```
  167. Pour rendre modifiable le nom de la colonne, c'est à dire une variable qui est déclarée dans la fonction `aes()`, c'est moins immédiat. L'exemple suivant ne fonctionnera pas :
  168. ```{r, eval = FALSE}
  169. my_bar <- function(df, col) {
  170. ggplot(df) +
  171. geom_bar(aes(x = col))
  172. }
  173. my_bar(mpg, drv)
  174. ```
  175. ```
  176. Erreur : Aesthetics must be valid data columns. Problematic aesthetic(s): x = var. Did you mistype the name of a data column or forget to add stat()?
  177. ```
  178. Pour résoudre ce problème, il faut utiliser une syntaxe particulière introduite dans la version 3.2 de ggplot2.
  179. Vous avez 2 solutions:
  180. - le nom de la colonne est passé en paramètre de la fonction comme un nom (c'est à dire sans "", par exemple `drv`), vous devez encadrer le nom de la colonne par des doubles accolades : `{{ col }}`
  181. ```{r, eval = FALSE}
  182. my_bar <- function(df, col) {
  183. ggplot(df) +
  184. geom_bar(aes(x = {{ col }}))
  185. }
  186. my_bar(mpg, drv)
  187. ```
  188. - le nom de la colonne est passé en paramètre de la fonction comme une chaine de caractère (par exemple: `"drv"`), vous devez utiliser la syntaxe suivante: `.data[[ col ]]`
  189. ```{r, eval = FALSE}
  190. my_bar <- function(df, col) {
  191. ggplot(df) +
  192. geom_bar(aes(x = .data[[ col ]] ))
  193. }
  194. my_bar(mpg, "drv")
  195. ```