Chapitre 12 ggplot2 : techniques avancées

12.1 Créer son propre thème ggplot2

Les thèmes de ggplot2 permettent de contrôler l’apparence des plots. Il est possible de modifier un thème standard en utilisant la fonction theme(). Mais nous allons voir ici comment créer un thème personalisé.

Il est bien entendu possible de créer un thème de toutes pièces. Pour cela, il faut définir un à un tous les éléments possibles du thème mais c’est très long et rébarbatif. Dans ggplot2, le seul thème défini de cette façon est le thème de base theme_grey() (voir le repo officiel). Les autres thèmes héritent les attribut de ce premier thème et modifient uniquement éléments nécéssaires. Par exemple, theme_bw() est construit à partir de theme_grey() et theme_minimal() se base sur theme_bw(). C’est beaucoup plus pratique de définir les thèmes de cette façon.

12.1.1 un thème est une fonction

Un thème est une fonction R classique qui prend comme arguments 4 variables : - base_size : taille de base du texte (défaut = 11) - base_family : famille de polices de base (défaut = "") - base_line_size : taille de base des éléments line (défaut = base_size / 22 ) - base_rect_size : taille de base des éléments rect (défault = base_size / 22 )

12.1.2 modifier un thème de base avec %+replace%

Ensuite, nous allons choisir un thème de base duquel notre thème personalisé va hériter les éléments par défaut. En effet, tous les éléments que nous ne spécifieront pas seront basés sur le thème de base. Par exemple, nous pouvons choisir theme_minimal().

Pour modifier les éléments du thème de base, il faut utiliser l’opérateur %+replace% suivi de la fonction theme(). C’est dans cette dernière que nous pourrons spécifier les différents éléments à modifier par rapport au thème de base.

12.1.3 définir de nouveaux attributs

Nous pouvons a présent inserer dans la fonction thème les éléments à modifier. Notez qu’il ne faut pas utiliser de tailles absolues mais définir des tailles relatives avec la fonction rel().

12.2 Utiliser ggplot2 dans des fonctions

Pour utiliser les syntaxes décrites ici, vous aurez besoin de ggplot2 version >= 3.2.

Prenons l’exemple d’une fonction qui réalise un bar chart (diagramme en barres) pour une colonne données (par exemple drv) d’un dataset (par exemple mpg, fourni avec ggplot2)

Le code pour réaliser ce plot en dehors d’une fonction peut ressembler à ceci :

Dans une fonction, nous voudrions pouvoir utiliser un autre dataset et changer le nom de la variable d’intérêt.

Modifier le nom du dataset ne pose pas de problème, et l’on peut utiliser une syntaxe classique :

Pour rendre modifiable le nom de la colonne, c’est à dire une variable qui est déclarée dans la fonction aes(), c’est moins immédiat. L’exemple suivant ne fonctionnera pas :

Erreur : Aesthetics must be valid data columns. Problematic aesthetic(s): x = var. Did you mistype the name of a data column or forget to add stat()?

Pour résoudre ce problème, il faut utiliser une syntaxe particulière introduite dans la version 3.2 de ggplot2. Vous avez 2 solutions: - le nom de la colonne est passé en paramètre de la fonction comme un nom (c’est à dire sans "", par exemple drv), vous devez encadrer le nom de la colonne par des doubles accolades : {{ col }}

  • le nom de la colonne est passé en paramètre de la fonction comme une chaine de caractère (par exemple: "drv"), vous devez utiliser la syntaxe suivante: .data[[ col ]]