Dernière mise à jour le : 6 Oct, 2020

Fivetran 

Fivetran est un outil Saas qui permet de créer des pipelines de données de manière très simple et robuste. Pour faire simple, c’est un connecteur déjà pré-configuré à plus de 150 sources de données.

Qu’est-ce que Fivetran ?

Certains appellent cela un “ELT” (Extract / Load / Transform). D’autres un outil de “data pipeline”. En réalité, je vois cela plutôt comme un “connecteur universel”.

D’un côté les sources de donnée. De l’autre un “Cloud data warehouse”. En général Google Big Query, Amazon Redshift ou Snowflake.

Pour résumer cela en un graphique :

 Screenshot 2020 10 06 at 12.01.23 | Fivetran

Connecteurs disponibles

Les “sources”

Le mieux est d’aller voir directement sur la page de Fivetran : https://fivetran.com/connectors

Mais citons quelques connecteurs très utilisés dans le monde du marketing digital :

analytics

publicité

Autres sources utiles

CRM

E-mailing et marketing automation

Customer Service

E-commerce

Exemples

Google Analytics et GA 360, Adobe Analytics, Mixpanel, Amplitude…

Adroll, FB Ads, Google Ads, LinkedIN Ads, Microsoft Ads, Criteo, Apple search ads, taboola,…

Google Search console, FB Page insights, Youtube Analytics..

Microsoft Dynamics, Hubspot, SAP, Salesforce…

Mailchimp, Marketo, Hubspot, Sendgrid…

Zendesk, Front, ServiceNow

Woocommerce, Magento, Prestashop, Shopify

Cas d’Usage

– Analyser en profondeur les analytics
– Croiser avec d’autres sources

– Faire le lien entre les campagnes (coûts) et les performances (CRM) / – Faire le lien entre les campagnes et le web analytics

Ajouter des données analytics externes

Faire le lien entre les actions de marketing digital et les résultats offline

Relier le marketing automation et les autres leviers

Faire le lien entre les données de support client et les données CRM

Analyser toutes ses données e-commerce de manière centralisée.

Bien entendu, on peut ajouter d’autres sources internes en se connectant directement aux bases de données.

Les “destinations”

Il s’agit de Data Warehouse dans le Cloud. Chez Unnest, nous utilisons généralement Google Big Query (au sein de Google Cloud Platform), ou Snowflake.

Screenshot 2020 10 06 at 12.02.23 | Fivetran

Pourquoi utiliser ce type d’outils ?

Pour réaliser un “data pipeline”, il est tout à fait possible de se connecter directement aux APIs. Par exemple, pour se connecter à de la donnée Google Search Console, on peut suivre les deux tutoriels ci-dessous :

Mais utiliser Fivetran donne un certain nombre d’avantages :

  • Gain de temps : imaginez que la création d’un pipe de data branché sur une source prend 3 jours à un data ingénieur. Il est assez rapide d’en calculer le coût.
  • Accessible pour un data analyst : plus important encore que les coûts, de nombreuses équipes ne disposent pas de ressources de data ingénieurs. Avec Fivetran, un data analyst peut en quelques clics déployer un pipeline data fonctionnel et robuste.
  • Maintenance, gestion des erreurs, déploiement : plus besoin de faire de DevOps, de gérer les erreurs ou les évolutions des APIs. Fivetran s’en occupe.
  • Connaissance des APIs : étudier les APIs de chacune des sources peut vite devenir un véritable enfer, et une perte de temps importante. L’une des forces de Fivetran est de maintenir la connaissance des modèles de donnée

Prenons un exemple, avec le modèle de donnée de Hubspot : https://docs.google.com/presentation/d/1KABQnt8WmtZe7u5l7WFUoPIsWzv63P9gsWF79XGLoZE/edit#slide=id.g244d368397_0_1

Screenshot 2020 10 06 at 12.25.14 | Fivetran

Autant dire que l’on est bien content de ne pas avoir à se plonger dans la documentation des APIs de Hubspot.

Concurrents de Fivetran

Les alternatives les plus courantes sont :

  • Stitch pour les plus gros projets data, et Segment dans une moindre mesure
  • Supermetrics et Funnel.io dans le monde du marketing digital

A noter que Supermetrics propose aussi des connecteurs pour Google Sheet, et pour Google Data Studio, ce qui en fait un outil intéressant dans certains cas d’usage.

Pricing de Fivetran

Le pricing de Fivetran est au volume. Il s’agit un modèle basé sur le nombre de lignes ajoutées ou mises à jour chaque mois (active rows).

Screenshot 2020 10 06 at 12.31.13 | Fivetran

Le mieux est de tester avec l’essai gratuit de 14 jours, ce qui permet d’avoir une estimation basée sur ses données.

N’hésitez pas à nous contacter si vous souhaitez une estimation pour votre cas d’usage.

Démo / tutoriel

Voir l’article ci-dessous pour suivre un tutoriel pas à pas montrant comment créer un premier pipeline de donnée : Tutoriel Fivetran : importer ses données dans Big Query

Dans cet exemple, nous utilisons Fivetran pour charger :

Suivez l'actualité Data

Newsletter UnNest

Ne manquez aucun contenu : recevez chaque mois la liste des derniers articles publiés.