La data pour l'analyse de données d'un CRM
Découvre le projet en data analyse de Sandrine qui grâce à un CRM clients a pu étudier le comportement clients d'une entreprise de médias.
Il y a 8 semaines, nos Databirdies, décidaient de se poser sur la branche de la Data. Depuis, ils ont pris leur envol vers de nouveaux horizons professionnels. Entre SQL, Excel, les stats, Python, les méthodes agiles et Tableau, leur palette de compétences s'est élargie. Le clou du spectacle durant le bootcamp : un projet concret et pratique sur lequel nous allons revenir avec l'un d'entre eux : Sandrine. Après 25 ans d'expérience, essentiellement dans les telecom, Sandrine s'est mise dans la peau d'une data analyst pour une grande chaine de télévision. Elle nous raconte.
Est-ce que tu pourrais te présenter ? Pourquoi cette volonté de te former à la data analyse ?
J’ai eu l’occasion de travailler avec des data analyst notamment sur un projet de CRM. J’ai été à la fois impressionnée par toutes les analyses issues des données du CRM (funnel ou évolution par cohorte, prédiction de transformation de ventes par exemple) mais surtout frustrée de ne pas être autonome pour les approfondir. Par ailleurs, avec un profil plutôt généraliste, je cherchais une spécialisation et une compétence différenciante pour faire ressortir ma candidature.
Peux-tu nous expliquer le déroulement du projet ? Pourquoi l’avoir choisi ? Sur quoi et avec qui travaillais-tu ?
Dès qu’Antoine et Alexandre nous ont parlé de la possibilité de travailler sur son propre projet, j’ai sollicité mes connaissances. Le contexte actuel n’offrait pas beaucoup de facilité et une première opportunité n’a pas pu se concrétiser.
Finalement, plus qu’un projet, j’ai cherché à obtenir des données brutes à partir desquelles trouver un axe d’analyse pertinent.
Un ancien collègue travaillant dans les médias, m’a proposé d’étudier le comportement d’un parc clients d’une chaine de son portefeuille. Après une rapide étude des données, une problématique a émergé et le projet était lancé.
La base de données représentait l’évolution du parc client entre le 1/01/2019 et le 30/06/2020 soit près de 70000 clients : les flux in des nouveaux clients et les flux out des résiliations.
Il a d’abord fallu agréger dans une base commune des données issues de différentes sources autour d’un user unique client : le profil des clients, les modalités de leur abonnement et leur ancienneté, leurs factures, leurs habitudes de consommation. Ensuite, nous avons pu étudier avec Pandas la performance de la chaine TV (CA, LTV), le profil des téléspectateurs actifs vs les churner et identifier les risques de son modèle économique: un parc qui régressait en volume et en valeur.
La formalisation des analyses s’est faite avec Tableau. Nous avons donc décidé de créer un modèle de prédiction des churners avec du Machine learning et proposer des actions de rétention.
Nous avons travaillé avec Olivier G, expert-comptable qui a travaillé sur la formalisation sous Tableau, Olivier V, issu d’une agence de publicité qui a travaillé sous Pandas sur la performance de la chaine, Sandrine, pour l’organisation du projet et la modélisation de la prédiction du churn en machine learning-bien aidés de nos assistants que nous avons souvent mis à contribution : en particulier Thomas et Jean-Eudes!
Quelles ont été les difficultés à surmonter lors du projet ?
Le plus complexe a été de trouver la bonne méthodologie à suivre pour construire notre démonstration (quels modèles de prédiction), d’adapter les algorithmes de machine learning aux enjeux business et de les formaliser concrètement pour des interlocuteurs opérationnels.
Comment vous êtes vous organisés ?
L’organisation et la répartition des tâches ont été les contraintes les plus impactantes dans la gestion du projet… surtout à distance ! (ndlr : dû à la crise sanitaire nous avons été contraints, à contre-coeur, de passer le projet en distanciel)Nous avons commencé par créer un tableau sous Trello avec toutes les étapes et leur deadline. Ensuite chacun s’est affecté des tâches en fonction de ses compétences.
Qu’est-ce que tu as aimé dans ce projet et qu’est-ce que tu en retires ?
Utiliser quasiment toutes les notions acquises pendant la formation : SpreadSheet, Tableau, Statistiques, Python Pandas et Machine Learning et construire des interactions entre ces différents outils assez complémentaires.
En faisant des recherches au sein des différentes communautés, on se rend compte également que bien souvent, il n’y a pas une seule solution pour faire avancer son projet mais une multitude et, malgré des lacunes avec un concept, on peut trouver des solutions alternatives pour avancer.
Quels sont tes projets pour l’avenir ?
Je ne sais pas si je vais directement travailler dans le domaine de la Data car je n’ai pas le profil étant à la fois senior mais débutant dans le domaine. Mais très clairement, dans mes futures missions, je vais maintenant systématiquement intégrer les outils de data analyse dans mes projets.
Un conseil à donner pour ceux qui voudraient postuler à DataBird ?
C’est un véritable engagement avec une importante charge de travail en complément des cours, il faut donc se rendre disponible totalement.
Il ne faut pas se décourager, le rythme est intense et la somme des notions à absorber est dense surtout les premiers jours. On peut avoir l’impression de ne rien absorber mais dès que l’on fait les exercices, tout s’éclaire !
Pour les apprenants avec mon profil, je le recommande si vous êtes amenés à construire des recommandations, des stratégies, des argumentaires objectifs et mesurés, bref pour des métiers de conseils.
Vous vous êtes sûrement demandé comment faire pour démêler le vrai du faux concernant l'IA en entreprise ? Rejoignez Baptiste lors de notre Data Talk pour échanger sur ce sujet captivant.
Je m'inscris