La gestion de l’attribution dans Google Analytics

La gestion de l’attribution dans Google Analytics

Le principe de l'attribution est assez simple : l'idée est de pouvoir attribuer une conversion (une vente, un formulaire rempli) à un canal d'acquisition, afin de pouvoir valoriser l'impact de ses actions marketing. Mais comme toujours en Analytics, ce n'est pas si simple. Dans cet article, nous analyserons comment traiter les sujets d'attribution dans Google Analytics.

Comment fonctionne l'attribution dans Google Analytics ?

Prenons un exemple simple :
  • Un internaute découvre mon site via le SEO dans Google, en tapant une requête "générique" (donc hors marque). Il ne connaissait pas ma marque. Il découvre mon site, et trouve le produit intéressant.
  • Il prend le temps de réfléchir, et revient 3 jours après, en tapant dans Google le nom de la marque, qu'il a retenue. Et il clique sur un lien sponsorisé (Google Ads)
  • Sur le site, il fait un achat d'une valeur de 100 euros
A qui attribuer la valeur créée ? Dans cet exemple c'est assez simple. A priori, c'est plutôt au SEO, puisque c'est par ce canal que la découverte du produit et de la marque a été faite.
Il s'agirait donc d'une attribution "premier clic" (first click)
Mais attention : ce n'est pas le fonctionnement par défaut de Google Analytics, puisque l'attribution par défaut est "dernier clic connu" (last click excluding direct). L'attribution se fera donc sur le canal "Paid search", sur une campagne "brand".
On voit par cet exemple toute l'importance de l'attribution dans la mesure de la performance des actions marketing, puisque les réglages par défaut conduisent à une sur-valorisation de ce que nous appelerons les "canaux parasites".
En particulier :
  • Le SEA "marque" (comme dans notre exemple ci-dessus).
  • Les comparateurs de prix
  • Les sites de code promo
Et dans une moindre mesure les leviers de "remarketing".
C'est pourquoi nous recommandons, dans la mesure du possible, de toujours suivre une notion de "first-click" en complément de la vison "last-click" par défaut.

Différents modèles d'attribution

Reprenons notre exemple, en rajoutant quelques étapes :
  • La première visite se fait sur du SEO "hors marque"
  • La seconde sur une campagne de remarketing
  • La troisième sur un clic Google ads "marque"
  • La dernière sur une visite "Direct"
Image without caption

Last "non-direct" click : la version par défaut

Image without caption
C'est ce que fait Google Analytics de manière implicite dans tous les rapports (et pas seulement les rapport d'attribution) : si une visite n'a pas de source (donc devrait être attribuée à du "direct"), alors Google analytics recherche quelle est la dernière source connue, et lui ré-attribue cette source. C'est un moyen artificiel pour Google de diminuer la part de "Direct" dans les rapports.
C'est ce modèle d'attribution qui est utilisé lorsqu'on regarde ce type de rapports :
Image without caption

Last interaction

Comme son nom l'indique :
Image without caption
On a quand même du mal à voir l'intérêt de cette mesure comparée à la précédente.

First interaction

Image without caption
Cette mesure nous semble la plus pertinente à mettre en oeuvre en complément de la mesure par défaut. En effet, cela donne plus de poids aux vrais leviers de "découverte" de l'offre, par rapport aux leviers "last touch", qui apportent en réalité moins de valeur que ce que la mesure pourrait laisser penser.

Linéaire ou autres répartitions

Exemple d'une attribution linéaire :
Image without caption
Bien entendu, toutes les subtilités sont possibles (répartition des poids, renforcement ou au contraire affaiblissement de certains leviers, etc...). Cependant, il faut avoir en tête que :
  • L'attribution se heurte à des limites techniques (cf en fin d'article)
  • Vous avez vous-même des limites dans votre capacité d'analyse de la donnée.
Aussi, sauf pour les gros annonceurs, il est souvent inutile de déployer des stratégies d'attribution extrêmement sophistiquées, alors même qu'on peut déjà faire énormément de choses avec :
  • L'attribution par défaut (last interaction, excluding direct)
  • L'attribution "first touch"

Data-driven attribution model

Bien entendu, lorsqu'on parle de "data", on se dit qu'on doit pouvoir faire quelque chose de plus subtil que "first-touch" ou "last-touch". C'est ce que propose Google au travers de ce qui est appelé, "Data-Driven attribution model".
L'idée est simple : le modèle d'attribution est calculé en fonction des données historiques réelles du compte.
Cette fonctionnalité était jusqu'à présent utilisée uniquement aux utilisateurs de Google Analytics 360. Mais depuis novembre 2019, un nouveau rapport (en beta) est disponible pour tous les utilisateurs.

Comment utiliser ces modèles d'attribution ?

Dans Google Analytics et Google Analytics 360, ces concepts d'attribution peuvent être traités à différentes endroits. Nous allons aussi voir comment utiliser ces modèles pour du reporting dans Google Data Studio :

Multi-channel funnel report

Accessible dans Google Analytics. Il est limité à 90 jours. On peut par exemple y comparer le "first-click" et le "last click" :
Image without caption
Ou encore les chemins de conversion les plus fréquents :
Image without caption
On a également accès à un module de comparaison des modèles :
Image without caption
Cela permet de se rendre compte de l'intérêt ou non de travailler sur un modèle d'attribution avancé.
La principale limite de cet outil est qu'il est réellement indépendant du reste de l'écosystème. Cela veut dire que vous ne pouvez pas simplement utiliser ces données dans du reporting.

Google Analytics attribution tool (beta)

Il faut tout d'abord activer la fonctionnalité, c'est à dire choisir quelle vue Google Analytics est concernée, et quels objectifs nous voulons viser par ce modèle d'attribution.
Image without caption
Il faut savoir qu'il y a certaines limites, en particulier
  • Il faut attendre 14 jours pour avoir les premiers résultats. 30 jours pour être complet
  • Plus vous avez de données de conversions, mieux c'est. En particulier, Google considère qu'il faut au moins 600 conversions sur la période analysée (qui va de 30 jours à 90 jours) pour que le modèle soit statistiquement pertinent
  • Plus vous avez de sources connectées à Google analytics (en particulier Google ads), mieux l'outil va fonctionner.
Une fois ceci mis en place, vous aurez accès à des rapports similaires à ceux du "multi-channel funnel report" en terme de contenus, mais un peu plus jolis, et surtout avec d'autres types de modèles.
Image without caption

Utilisation pour le reporting

C'est un peu le point noir. Techniquement, l'API "Multi-channel Funnel" (https://developers.google.com/analytics/devguides/reporting/mcf/v3) est différente de l'API "Google analytics reporting API" (https://developers.google.com/analytics/devguides/reporting/core/v4).
Or, c'est ce dernier qu'utilise le connecteur natif Google analytics → Google data studio. Il ne permet pas de remonter ces informations. Il existe différentes possibilités, mais en particulier :
  • Pour les riches : Si vous avez Google Analytics 360 et un Marketing Data Warehouse (BigQuery par exemple), alors vous pouvez travailler sur la donnée brute, et créer les reporting comme bon vous semble.

Les limites : le consentement, et la portée des cookies

Il faut être conscient que l'attribution est toujours partielle, et conditionnée essentiellement à deux aspects :
  • La part des internautes qui consent
  • Les difficultés techniques à identifier un utilisateur sur la durée

Le consentement

Qu'on se base sur la RGPD ou la directive ePrivacy, en ce qui concerne le web analytics, on en revient souvent au sujet du consentement.
Si je n'ai pas le consentement d'une partie de mes utilisateurs (par exemple 10%), alors je vais perdre de l'information. En fonction de la manière dont j'implémente le tracking :
  • Soit la donnée de conversion n'est tout simplement pas enregistrée, et donc mon nombre de conversions va baisser
  • Soit les conversions sont enregistrées, y compris sans consentement, et donc je vais avoir des informations aggrégées, qui vont rendre l'attribution moins précise.
Dans tous les cas, il faut accepter que la donnée est forcément incomplète ou imparfaite.

Les limites techniques

La principale limite technique est la difficulté à identifier un utilisateur unique :
  • Cela peut être sur la durées, car son cookie a été supprimé. C'est notamment le cas de Safari (sur mac et sur iPhone), qui supprime tous les cookies "client side" au bout de 7 jours sans visite de l'utilisateur. Cela signifie que si un utilisateur revient après plus de 7 jours, vous n'aurez que sa dernière visite, et l'attribution se fera donc sur le dernier clic.
  • Et bien entendu, un cookie est lié à un navigateur. Donc à moins d'avoir un système d'identifiant unique (un client logué), il faut être conscient qu'une visite commencée sur mobile et terminée sur Desktop par exemple, ne pourra pas être suivie comme appartenant à la même personne.

Que penser de ces limites ?

Pour chaque limite, on peut mettre en place des procédés plus ou moins complexes pour en limiter l'impact. Mais on ne peut pas empêcher une perte de donnée.
Il faut donc garder cela en tête pour relativiser l'analyse qui est faite de l'attribution. Surtout, il est important de garder du bon sens, et de bien comprendre que dans tous les cas, le "last-click" est toujours sur-évalué dans l'attribution.
Il faut donc également considérer avec attention les sources qui vous ramènent de l'audience, mais pas de conversion. Elles contribuent probablement plus à la conversion que vous ne le pensez.