Dernière mise à jour le : 30 Sep, 2020

Data Studio : utiliser un “Waterfall chart” pour comparer les données vs année précédente

Le “waterfall chart” est probablement le type de graphique le plus sous-estimé dans le monde de la DataViz. Il permet de représenter de manière très intuitive les facteurs d’évolution d’une période à une autre. Dans cet article, nous allons voir comment représenter les évolutions vs l’année précédente dans Google Data Studio.

L’objectif

Lorsque que l’on souhaite montrer l’évolution de performance d’indicateurs (par exemple ici, la source des visites Google Analytics), on utilise souvent cette représentation :

Screenshot 2020 09 30 at 13.47.16 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Elle permet de voir en un coup d’oeil :

  • Les chiffres de chacun des canaux
  • Leur part relative
  • Ceux qui montent, et ceux qui baissent.

En revanche, cette visualisation ne rend pas bien compte de la contribution de chacun des canaux à la hausse ou à la baisse globale.

Pour cela, nous allons utiliser un “waterfall chart” qui représente les hausses (en vert), les baisses (en rouge), et finalement le total des hausses et des baisses (en gris) :

Screenshot 2020 09 30 at 13.52.52 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Dans cet article, nous allons voir comment générer ce waterfall chart dans Google Data Studio

Version 1 : calcul de dates et “blended data source”

Dans ce tutoriel, nous allons voir 3 choses intéressantes :

  • L’utilisation des nouvelles fonctions de calcul sur les dates, disponibles dans Google Data Studio
  • Comment joindre une source de donnée avec elle-même pour générer une comparaison vs année précédente.
  • L’utilisation de la visualisation “waterfall chart” dans Google Data studio.

Nous partons d’une source de donnée “Google analytics” classique

Etape 1 : calcul de la date de l’année dernière

Dans ma source de donnée principale, je vais créer 2 champs calculés :

  • La date de cette année (en format simplifié)
  • La même date, l’année précédente

Calculated date : TODATE(Date,'DEFAULT_DECIMAL','%Y%m%d')

Screenshot 2020 09 30 at 13.58.10 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

La date moins 1 an : pour cela, nous utiliserons la toute nouvelle et très pratique fonction “DATETIME_SUB” : TODATE(DATETIME_SUB(Date, INTERVAL 1 YEAR), 'DEFAULT_DECIMAL', '%Y%m%d')

Screenshot 2020 09 30 at 13.58.55 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

J’ai donc simplement créé 2 nouvelles dimensions :

Screenshot 2020 09 30 at 14.08.33 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Comparer les données avec l’année précédente

Nous allons réaliser une jointure de cette table avec elle-même, afin d’ajouter la colonne “Sessions last year”.

Pour cela, créer une nouvelle source de type “blended data” et faire les réglages exactement comme ci-dessous. Attention en particulier à bien choisir le “date range” approprié.

Screenshot 2020 09 30 at 14.12.50 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

J’ai donc généré le tableau suivant :

Screenshot 2020 09 30 at 14.15.27 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Je vais maintenant y ajouter le calcul de la différence : “sessions this year – sessions last year”. On ne peut pas créer de champ calculé dans une source de type “blended”. Nous allons donc faire un champ calculé directement dans le graphique :

Screenshot 2020 09 30 at 14.18.14 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Maintenant, je vais ajouter le “Default channel grouping” à ma nouvelle source de donnée. Car c’est cela que je souhaite calculer. J’édite donc ma source. Et j’en profite pour ajouter les métriques dont je vais avoir besoin (par exemple les sessions + les conversions).

Attention : ne pas confondre “Default Channel Grouping” (ce que nous souhaitons mesurer ici) et “Acquisition channel”. Ce n’est pas la même chose, et le “Acquisition channel” vous causera une erreur.

Screenshot 2020 09 30 at 14.19.39 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Voilà : j’ai donc la source de donnée que je vais utiliser pour mon “waterfall chart”

Construire le “waterfall chart”

Aller dans “Community visualisations” → Waterfall

Screenshot 2020 09 30 at 14.23.33 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Par défaut, il va vous montrer la contribution de chaque segment au total :

Screenshot 2020 09 30 at 14.25.05 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Mais ce n’est pas ce que nous voulons, puisque nous souhaitons visualiser la contribution de chaque segment à la variation par rapport à l’année précédente.

Je vais donc à nouveau créer un champ calculé “Delta”. Et voilà le résultat !

Screenshot 2020 09 30 at 14.27.20 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Version 2 : Extract data + “blended data source”

Une seconde version, plus simple et plus robuste que la première, et qui provient de cet article : https://michaelhoweely.com/2020/09/30/how-to-map-growth-in-google-analytics-sessions-by-country-in-data-studio/

Elle consiste à créer 2 sources de données : une pour cette année, une pour l’année précédente. Et de les joindre (blended data source).

On perd la granularité à la journée, mais pour une comparaison d’une année sur l’autre, c’est parfait.

Créer les “extracted data sources”

Nous allons utiliser le connecteur “Extract Data”. Nous choisissons les métriques et dimensions que nous allons vouloir comparer (dans mon cas, je veux comparer sur les “channel” et sur les pays. En ce qui concerne la date, nous choisissons “this year to date”

 Screenshot 2020 10 01 at 11.46.06 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Puis nous créons une copie, en changeant simplement le nom des métriques pour plus de clarté, et la date d’extraction :

Screenshot 2020 10 01 at 11.58.17 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Créer la jointure

Nous allons maintenant créer une “blended data source” comme ceci :

Screenshot 2020 10 01 at 11.59.45 | Waterfall Chart dans Data Studio pour comparer les données vs année précédente

Et voilà. Ensuite, on utilise les données de la même manière que précédemment.

Suivez l'actualité Data

Newsletter UnNest

Ne manquez aucun contenu : recevez chaque mois la liste des derniers articles publiés.