Visualisation de données : éléments théoriques et applications avec R
Prerequis
Installer R
Installer RStudio (facultatif)
Installer les packages nécessaires
1
Intro
1.1
Définition
1.2
TODO
2
UE Visualisation
2.0.1
2019-2020
2.1
Dr. Antoine Neuraz
2.1.1
AHU Informatique médicale
2.1.2
1ère moitié du cours: théorie
2.1.3
2ème moitié du cours: mise en pratique
3
Visualisation
4
Pourquoi visualiser graphiquement ?
5
Pourquoi mettre un ordinateur dans la boucle ?
5.1
##
Passage à l’échelle
5.2
Efficience
: réutilisation, diffusion
6
Buts d’une visualisation
7
Définition
7.0.1
La visualisation est le processus qui
transforme
les données en
représentation graphique
interactive à des fins d’
exploration
, de
confirmation
ou de
communication
.
8
Pourquoi ne pas se limiter aux statistiques ?
9
Anscombe’s quartet
10
Datasaurus dozen
10.1
Un peu d’histoire: enregistrer
10.1.1
John Snow (1854)
11
1 second of internet
12
Types de datasets
12.1
13
Autres caractéristiques des données
13.0.1
Liens
: relation entre 2 entités (observations, noeuds)
13.0.2
Positions
(données spatiales)
13.0.3
Grilles
(grids) : stratégie d’échantillonage de données continues
14
Variables quantitatives
14.0.1
Intervalles
= zéro arbitraire
14.0.2
Ratios
= zero absolu
15
Marques et échelles
16
Marques pour observations
16.1
Eléments géométriques de base
16.1.1
Contrôle l’apparence proportionnellement ou en fonction de variables
17
Utiliser les marques et les échelles
18
Utiliser les marques et les échelles
19
Utiliser les marques et les échelles
19.0.1
Longueur, position et Luminosité
19.1
Echelles - efficience
20
Types de datasets et types de données
20.1
Types de datasets
20.1.1
Données tabulaires
20.1.2
Réseaux
20.1.3
TODO: Champs
20.1.4
TODO: Spacial
20.2
Types de données
20.2.1
TODO
21
Perception : système visuel, marques et canaux, couleurs
21.1
TODO
21.2
Types de marques
21.3
Mappings in ggplot
21.4
scales in ggplot
22
Abstraction de tâche
22.1
TODO
23
Principes de design
23.1
TODO
24
Visualisation de données tabulaires
24.1
TODO
25
Interaction
25.1
TODO
26
Visualisation de données spatiales
26.1
TODO
27
Visualisation de réseaux et graphes
28
Visualisation de texte
28.1
TODO
29
Visualisation de texte
29.1
TODO
30
ggplot2
: techniques avancées
30.1
Créer son propre thème
ggplot2
30.1.1
un thème est une fonction
30.1.2
modifier un thème de base avec
%+replace%
30.1.3
définir de nouveaux attributs
30.1.4
Exemple
30.2
Utiliser
ggplot2
dans des fonctions
References
30.3
ggplot2 implémente la grammaire de la visualisation
30.4
Les essentiels
30.5
### Data: Données source.
30.6
### Geoms: Marques de la visualisation (points, lignes, …)
30.6.1
Scales: Echelles de la visualisation (position, taille, couleur,…)
30.7
La base
30.8
Ajouter une geometrie
31
Ajouter un encodage (aesthetics)
31.1
Ajouter une facette
31.2
Ajuster la légende
31.2.1
site du tidyverse:
https://ggplot2.tidyverse.org
31.2.2
R for datascience:
https://r4ds.had.co.nz/
31.2.3
stackoverfow:
https://stackoverflow.com
31.2.4
votre moteur de recherche préféré
32
TODO 2
32.0.1
représenter la distribution du nombre de miles per gallon en histogramme
32.0.2
représenter la distribution du nombre de miles per gallon en boxplot
32.0.3
representer la distribution du nombre de miles per gallon en fonction du nombre de cylindres
32.0.4
ajouter les points par dessus la distribution
32.0.5
paufiner le plot (axes, titres, thème)
Published with bookdown
Visualisation de données : éléments théoriques et applications avec R
Chapitre 15
Marques et échelles