Qu'est ce que Dataiku ?

Dataiku est une plateforme unifiée de data science qui permet de centraliser, manipuler et automatiser facilement son pipeline de donnée sans avoir nécessairement besoins de hard skills en languages de programmation (même si ça peut permettre d’aller plus loin sur certains points). L’outil a été pensé comme une plateforme collaborative dans laquelle il est simple de travailler en équipe, de partager des workflow de traitement de données, etc. Véritable couteau suisse servant autant à automatiser de petits traitements récurrents en local que de gros pipeline data très complexes en complément d’autres outils comme AWS, Azure, GCP, etc.

No items found.

Les avantages de Dataiku ?

Un outils simple à prendre en main

L’ensemble des ses fonctionnalités no-code permettent facilement à l’ensembles de vos équipes de travailler sur des pipelines data plus ou moins complexes et ce, peu importe leurs hard skills respectifs.

Un outil puissant et complet

Bien qu’assez simple à prendre en main, dataiku permet d’aller très loin dans l’ingestion, le traitement, l’automatisation et l’activation de la donnée. Il est notamment possible de faire intervenir du SQL, du R ou encore du Python a n’importe quel moment; d’utiliser facilement des algorithmes de ML et d’IA via datalab, etc.

Un outil collaboratif

Comme expliqué dans l’introduction, la plateforme est pensé à la base comme un outil collaboratif, intégrant notamment des fonctionnalités permettant d’optimiser le partage et l’échange au sein des équipes data et des équipes commerciales. Il s’agit notamment d’outils de gestion de projet, de chat, de wiki et de versions. Il est très facile de partager ses Workflow avec ses collaborateurs, de créer des templates, d’organiser la gouvernance etc.

Pourquoi ce partenariat est important ?

Les cas d’usage unnest avec Dataiku

Actuellement, nous utilisons principalement dataiku comme un outil interne que comme outil ayant vocation à servir de livrable. J’ai cependant quelques éléments intéressants à partager qui illustrent bien le potentiel et la versatilité de l’outil :

  • Création d’un scoring client :Dans le cadre d’un projet client, nous devions créer un modèle qui servirait à identifier les utilisateurs les plus susceptibles de s’engager avec un programme selon leur profil dès l’inscription.Dans ce cadre, nous avons mis en place un pipeline complet de donnée allant de la récupération dans BigQuery, le nettoyage dans Dataiku et l’activation de la donnée en utilisant différents modèles de ML pour nous aider à identifier et pondérer les critères discriminants pour enfin créer plusieurs versions de scorings et tester les résultats sur de la données historique pour sélectionner le meilleur modèle et valider son efficacité.

L'avis de notre expert

Découvrir les autres outils

tout VOIR