GGPLOT2

A 30-post collection

Les strip plot GT24

By Ludovic Vigneron |  Apr 23, 2024  | dataviz, finance, ggplot2, gt, r
Enchaînons sur la série GT avec les strip plot. Il s’agit ici, non plus comme avec les histogrammes de figurer les observations au travers d’objets dont la taille et la forme varie en fonction de la fréquence d’une valeur, mais plus directement de montrer les données. Pour ce faire, chaque observation est représentée par un point placé en fonction de sa valeur le long d’un axe vertical ou horizontal unique.
Continue Reading...

Les graphes en pyramides GT23

By Ludovic Vigneron |  Mar 4, 2024  | dataviz, ggplot2, gt, r, finance
Venons-en à notre second post de la sous-série de GT consacrée à l’illustration distribution des variables quantitatives. Il s’agit ici de traiter des histogrammes en pyramide. Ceux-ci permettent de faciliter la comparaison de la distribution d’une variable entre deux groupes d’observations. Ils sont souvent mobilisés en démographie pour mettre en regard les effectifs des différences classes d’âge pour chaque sexe (pour une zone géographique et à une date donnée). Le principe du graphe est simple.
Continue Reading...

Les histogrammes GT22

By Ludovic Vigneron |  Jan 1, 2024  | dataviz, finance, ggplot2, gt, r
Ce post ouvre une nouvelle partie de la série GT. Après avoir traité des représentations utilisées pour rendre compte des variables discrètes et de celles utilisées pour les séries temporelles, nous traitons maintenant de la manière de représenter les distributions de variables continues. Le premier type de graphe que nous aborderons est un grand classique. Il s’agit de l’histogramme. Celui consiste en une série de barres accolées à la manière d’un bar plot classique.
Continue Reading...

Les slope charts GT21

By Ludovic Vigneron |  Dec 18, 2023  | dataviz, dataviz, ggplot2, ggplot2, gt, gt, r, r
Dans ce dernier post consacré aux graphes destinés à illustrer l’évolution d’une ou plusieurs variables dans le temps, nous allons nous intéresser aux diagrammes de pentes ou slope charts. Il s’agit de la combinaison de lignes horizontales dont le degré d’inclinaison représente l’évolution d’une variable quantitative entre deux dates pour différents individus ou groupes, et de points marquant les valeurs de départ et d’arrivé de manière à mettre en avant des proximités (clustering) et des éloignements (outliers).
Continue Reading...

Gérer et manipuler les dates (2)

By Ludovic Vigneron |  Nov 11, 2023  | cours, finance, ggplot2, r, var_temps
Continuons notre point sur la manipulation des données de dates. Traitons ici de la mise en forme de l’axe décrivant le temps dans les graphes de séries temporelles. Comme toujours (ou presque), nous travaillerons à partir de ggplot2. Commençons par charger les packages, ceux permettant d’établir le graphe (tidyverse et scales) et autre pour les obtenir les données. Ici, nous utiliserons des données de cotations d’actions. Nous les chargerons à partir de l’API de yahoo finance à partir des tickers correspondant.
Continue Reading...

Le nuage de points connectés GT20

By Ludovic Vigneron |  Aug 28, 2023  | dataviz, dataviz, gt, gt, ggplot2, ggplot2, r, r
Dans cet avant dernier post consacré à la représentation des séries temporelles, nous revenons sur la question de l’évolution du lien entre deux variables dans le temps. Nous l’avions déjà aborder lorsque nous avions traité des graphes à doubles ordonnées (dual axis plot). J’avais alors émis certaines réserves concernant cette représentation, qui peut donner l’illusion d’une corrélation voir d’une causalité. J’avais alors indiqué ma préférence pour les nuages de points quitte à marquer le temps à l’aide d’une progression de couleurs.
Continue Reading...

Les stream graph GT19

By Ludovic Vigneron |  Jul 17, 2023  | dataviz, dataviz, ggplot2, ggplot2, gt, gt, r, r
Enchaînons avec une catégorie de graphes, à mon avis, plus spectaculaire: les stream graph (en français graphes de flux). Il s’agit d’une forme d’aera charts superposés et articulés autour d’un axe central. Il présente un aspect organique qui engage le lecteur à en déchiffrer les informations. Celles-ci sont simplement plusieurs séries temporelles exprimées dans la même unités. L’objectif ici est plus d’illustrer l’évolution relative des quantités représentées dans le temps que leur valeur exacte qui apparaît difficile à lire.
Continue Reading...

Les diagrammes de Gantt GT18

By Ludovic Vigneron |  Jul 10, 2023  | dataviz, ggplot2, gt, r
Après une pose d’un peu plus d’un mois due aux cycles des congrès et à la fin de l’année universitaire, revenons à notre série GT. Continuons la sous-série des graphes présentant dans séries temporelles avec le diagramme de Gantt. Celui-ci est principalement utilisé dans le cadre d’outils de gestion de projets avec les réseaux PERT. Il est néanmoins possible d’être créatif et d’étendre son application à d’autres contextes. A la base, il s’agit simplement, dans un repaire avec un axe reprenant une mesure de temps et un axe autre présentant différents individus (ou tâches…), de séries de segments marquant et positionnant dans le temps un état défini (la participation à un projet…).
Continue Reading...

Les Area chart GT17

By Ludovic Vigneron |  Apr 28, 2023  | dataviz, ggplot2, gt, r
Revenons sur nos graphes présentant des séries temporelles. Leur représentation la plus classique, nous l’avons vu, consiste à établir une courbe associant en ordonnées les valeurs aux dates de mesure en abscisses. Cela permet d’obtenir une vision claire des tendances mais laisse généralement peu de place à la mise en valeur des effets cumulés des évolutions. Une possibilité pour remédier à cette relative faiblesse est de mettre en avant l’aire sous la courbe.
Continue Reading...

Le Cycle plot GT16

By Ludovic Vigneron |  Mar 23, 2023  | climat, dataviz, dataviz, ggplot2, gt, r
Laissons de côté les données de classement et revenons à des séries temporelles plus classiques. Ces séries sont généralement caractérisées de deux éléments structurant se cumulant avec la dimension aléatoire: une saisonnalité et une tendance de long terme. Si ces dimensions peuvent être observées sur les courbes des séries. Néanmoins, sauf cas particuliers où les choses sont fort marquées, le visuel classique trouve rapidement ses limites. Cela conduit généralement à travailler à partir de décomposition des séries en trois courbes (effet saisonnier, tendance, aléa).
Continue Reading...