Partager

cover art for #126 - Comment l’ex-Head of Data de Lydia monte le département Data chez May

DataGen

#126 - Comment l’ex-Head of Data de Lydia monte le département Data chez May

Christelle Marfaing, ex-Head of Data de Lydia, est aujourd’hui Chief Data Officer de May, la startup qui a développé une app d’avantages salariés (3 millions d’euros levés en 2022).


Cet épisode est le 1er d’une nouvelle série dont l’objectif est d’inviter des Head of Data qui ont déjà monté ou structuré une équipe Data et qui recommencent dans une plus petite structure.

Aujourd’hui, Christelle nous parle du lancement du département Data chez May après avoir dirigé une équipe de 14 personnes chez Lydia.


On aborde :

🔥 Son choix de rejoindre une jeune startup après son passage chez Lydia

🔥 Le contexte data chez May, ses premières initiatives et ses choix techno (Airbyte, Dagster…)

🔥 2 sujets qu’elle décide de lancer très tôt : Data Contracts et RGPD

🔥 Sa vision sur la GenAI et comment elle est utilisée au sein du Produit chez May.


---


❤️ PARTENAIRE


Ce podcast est rendu possible par Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.

👉 Contactez Benjamin pour vous faire accompagner

Son mail : bcohen@eulidia.com

Son LinkedIn : https://www.linkedin.com/in/cohenlhyver/

👉 Mettez Elisa également dans la boucle

Son mail : echarbonnier@eulidia.com

Son LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/


---


🎬 CHAPITRES


00:00 Générique

01:46 Intro

02:54 Pourquoi revenir en startup après Lydia ?

04:41 Présentation de May

07:13 Le contexte data à son arrivée

07:55 Ses premières initiatives : POC, Data Contracts, RGPD

14:39 La stack mise en place (Airbyte, Dagster…)

17:29 Buy vs build

25:00 Sa vision sur la Generative AI


---


🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


 🇬🇧 #106 - Aircall: Adapting the Data Strategy to the slowing economic environment

#77 - Sunday : Scaler grâce à une orga Data Mesh

#50 - Ledger : Monter le département Data d'une licorne


---


👋 PLUS DE CONTENU DATA ?


1/ Suivez-moi sur LinkedIn ici 🤳

2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


---


🎙 SOUTENEZ LE PODCAST GRATUITEMENT


1/ Abonnez-vous 🔔

2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

More episodes

View all episodes

  • #129 - BlaBlaCar : Scaler l’impact de l'équipe Data Engineering

    26:38
    📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin : ICI 📆Thibault Ambard est Data Engineering Manager chez BlaBlaCar, la plateforme de transports partagés (voiture et bus) leader en Europe avec 20 millions d’utilisateurs en France. Aujourd’hui il vient nous parler de la réorganisation et des nouveaux outils qu’ils ont mis en place pour scaler l’impact de l’équipe.On aborde :🔥 Le contexte de départ côté Data Engineering (manque d’ownership, difficulté à prioriser…)🔥 Leur réorganisation par squad inspirée du Data Mesh et comment elle résout ces problèmes🔥 L’adaptation de la stack à la nouvelle organisation avec notamment la mise en place de dbt🔥 Les nouvelles difficultés pour mener des projets transverses (ex: pratiques de Software Engineering).---❤️ PARTENAIRECe podcast est rendu possible par Popsink, la plateforme d'intégration et de traitement de données en temps réel.👉 Contacter Benjamin sur Linkedin ou découvrir l’outil ici.📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin ICI---📚 RESSOURCES- An Elegant Puzzle de Will Larson- Le code a changé- Christophe Blefari fait partie du Collectif de freelance DataGen, contactez-nous pour travailler avec lui---🎬 CHAPITRES00:00 Générique01:30 Intro03:27 Le contexte autour de la réorganisation04:54 L’orga aujourd’hui06:42 Comment la réorg a résolu les problèmes initiaux11:20 L’adaptation de la stack17:36 Les étapes clés de la mise en place de dbt20:41 Les principales difficultés22:00 Les prochaines étapes pour l'équipe Data24:09 Les questions de la fin (ressources, conseils...)---🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#112 - MyLight Systems : Migrer vers une Modern Data (& AI) Stack avec Databricks#102 - Databricks : Une stack unique pour l’Analytics et l’IA---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?Suivez-moi sur LinkedIn 🤳
  • #128 - Le temps réel, grande tendance de 2024 avec Benjamin Djidi, CEO @Popsink

    20:20
    📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin : ICI 📆Benjamin Djidi est le CEO de Popsink, la plateforme d'intégration et de traitement de données en temps réel. Fin 2023, j’ai enregistré un épisode sur les tendances data de 2024 avec Christophe Blefari (alias Blef). Une des plus grosses tendances de l’année est le temps réel et Blef m’avait parlé d’une nouvelle solution : Popsink. J’ai donc invité Benjamin sur le podcast pour en savoir plus.On aborde :🔥 Le parcours de Benjamin et la genèse de Popsink🔥 Le cas d’usage type et la différence avec un ETL “classique” (Fivetran, Airbyte, Rivery…)🔥 Les 2 atouts du temps réel : faible latence et baisse des coûts🔥 Pourquoi le temps réel est particulièrement adopté en 2024 ?---❤️ PARTENAIRECe podcast est rendu possible par Popsink, la plateforme d'intégration et de traitement de données en temps réel.👉 Contacter Benjamin sur Linkedin ou découvrir l’outil ici.---🎬 CHAPITRES00:00 Générique01:02 Intro03:04 Les cas d'usage type03:54 La différence avec un ETL “classique”11:03 Pourquoi le temps réel est particulièrement adopté en 2024 ?15:36 Les questions de la fin (ressources, conseils...)---📚 RESSOURCES- La newsletter de Blef- La newsletter de Yaroslav Tkachenko, ex-Staff Data Engineer @Shopify et Principal Software Engineer @GoldSky- Les articles d’Hubert Dulay---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#102 - Databricks : Une stack unique pour l’Analytics et l’IA#100 - On décrypte 3 tendances data de 2024 avec Christophe Blefari (aka Blef.fr) 🎁#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast sur YouTube ici 📹
  • #127 - Doctolib : Déployer une stratégie IA Générative

    35:08
    Nacim Rahal est Senior Director Data & AI chez Doctolib, la licorne qui propose une plateforme de prise de rendez-vous avec des médecins et qui permet également de faire de la téléconsultation.On aborde :🔥 La stratégie GenAI de Doctolib (la genèse, l’approche, les use cases…)🔥 DoctoGPT (aka leur ChatGPT interne) et le projet Medical Assistant🔥 Leur organisation pour déployer ces projets et l’impact sur la stack🔥 Leur plus gros challenge et les prochaines étapes---❤️ PARTENAIRECe podcast est rendu possible par Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/---🎬 CHAPITRES00:00 Générique01:40 Introduction06:22 La genèse GenAI chez Doctolib12:22 Zoom sur DoctoGPT (ChatGPT interne)15:07 Zoom sur Medical Assistant (Core Product)18:12 Leur organisation pour déployer ces projets GenIA20:01 L’approche “start-up”21:17 L'impact sur l'équipe tech et la stack data25:32 Les plus gros challenges GenAI28:10 Les next steps sur les sujets GenAI29:32 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESLe podcast Acquired et en particulier les 3 épisodes avec Nvidia---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#117 - Masterclass | Tout comprendre sur les IA Génératives avec Benjamin Cohen-Lhyver#115 - Doctolib : Scaler sa Data Visualisation auprès de 2000 utilisateurs#11 - Doctolib : Accélérer la mise à disposition des données grâce à une réorganisation---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #125 - Reconversion | De Directeur de Magasin à Data Analyst

    16:04
    Vincent Gossiaux était Directeur de Magasin et s’est reconverti vers un rôle de Consultant Data Analyst chez Elevate, le cabinet de conseil spécialisé en data.On aborde :🔥 Son parcours et ce qui l’a poussé à se reconvertir dans la data,🔥 Pourquoi il a choisi DataBird et le déroulement de la formation,🔥 Les compétences qu’il utilise le plus au quotidien,🔥 Ses principaux chantiers actuels et ses conseils pour se reconvertir.---❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : bit.ly/47UthCv---🎬 CHAPITRES00:00 Générique01:02 Intro02:45 Le moment où Vincent décide de changer de carrière04:21 Focus sur la formation DataBird06:40 Son arrivée chez Elevate, cabinet de conseil en data08:48 Ses principaux chantiers au quotidien10:43 Ce que la formation lui a apporté11:43 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESLa newsletter Blef de Christophe BlefariLa chaîne Youtube de Luke Barousse---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#118 - Reconversion | Des Ressources Humaines à Data Analyst spécialisée RH#103 - Reconversion | De Responsable Études de Marché à Data Analyst#95 - Reconversion | De Journaliste à Data Analyst#71 - Lancer sa carrière data avec Kevin Rosamont Prombo---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #124 - ManoMano : L’ex-Chief Product Officer partage sa Stratégie Data

    34:27
    Pierre Fournier est l’ancien Chief Product Officer de ManoMano, la licorne qui propose un site e-commerce spécialisé dans le bricolage. Elle est présente sur 6 marchés (France, Belgique, Espagne, Italie, Allemagne, Royaume-Uni), compte aujourd’hui plus de 5 000 marchands et 19 millions de références.On aborde :🔥 Les prémices de la data chez ManoMano au Marketing et au Produit,🔥 Pourquoi il ne faut pas être trop data-driven lorsqu’on fait du Produit,🔥 L’importance de définir des métriques utilisateurs (versus business),🔥 Ses plus gros challenges data : tracking, culture et collaboration Data x Produit.---❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : bit.ly/47UthCv---🎬 CHAPITRES00:00 Générique01:12 Intro02:18 Pierre nous explique ses choix de carrière04:04 Son point de vue sur les GAFAM06:03 Leur ADN data07:59 Être ou ne pas être trop data driven, telle est la question13:17 L’importance des métriques utilisateurs versus business22:08 La collaboration entre les équipes Data et Produit25:34 Ses plus gros challenges data28:07 Ses conseils aux équipes Data pour mieux collaborer avec le Produit30:39 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESData Strategy de Bernard MarrStatistics Done Wrong de Alex ReinhartRelevant Search de Doug Turnbull & John Berryman---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#97 - Contentsquare : Lancer l’équipe Product Analytics#53 - Pennylane : Utiliser la data en tant que Product Manager#44 - IbanFirst : Mieux collaborer avec l'équipe Produit#36 - Dashlane : Monter une équipe Product Analytics---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹---🔔 ABONNEZ-VOUS POUR SOUTENIR LE PODCAST GRATUITEMENT ! 🥰
  • #123 - Starburst : Accélérer l’accès au Data Lake et attaquer plusieurs sources en une requête

    23:22
    Jérôme Campo est Solution Architect chez Starburst, la licorne américaine valorisée 3 milliards de $ qui propose une solution qui permet de requêter les Data Lake et de les fédérer avec d'autres sources, avec des grosses performances et avec des coûts très compétitifs. Pas très connue du grand public, c'est pourtant la solution qui est déjà utilisée par quasiment la moitié du CAC 40.On aborde :🔥 Son parcours entre Microsoft, Google, Cloudera et Starburst🔥 La technologie Open Source sous-jacente fondée en 2012 chez Facebook (aka Presto)🔥 Les 2 usages de Starburst : accélérer l’accès au Data Lake et attaquer plusieurs sources en une seule requête🔥 Où se positionne l’outil dans la stack versus le Data Warehouse, Fivetran, dbt…---❤️ PARTENAIRESCe podcast est rendu possible par :Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/Starburst, la solution qui permet de requêter les Data Lake et de les fédérer avec d'autres sources.👉 Contactez Jérôme pour en savoir plusLeur site : https://engage.starburst.io/frSon mail : jerome.campo@starburstdata.comSon LinkedIn : https://www.linkedin.com/in/jérôme-campo-06344019/---🎬 CHAPITRES00:00 Générique01:41 Intro03:34 À quoi sert Starburst ?05:07 1er usage : accélérer l’accès au Data Lake (Hadoop)07:17 Illustration avec Crédit Mutuel Arkea09:59 2ème usage : attaquer plusieurs sources avec une seule requête (multi-source / multi-cloud)12:51 Le positionnement de Starburst dans la Stack Data (Warehouse, Fivetran, dbt)14:37 Paysage concurrentiel15:55 La fonctionnalité de Starburst compatible avec l’approche Data Mesh18:32 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESLe LinkedIn de Zak WilsonLe User Group de Starburst---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#117 - Masterclass | Tout comprendre sur les IA Génératives#111 - DataGalaxy : Mettre en place un Data Catalog#91 - Spendesk : Adopter l'approche Analytics Engineering---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #122 - 360Learning : Déployer un projet GenAI avec GPT-4

    28:35
    Marie Douriez est Machine Learning Engineer chez 360Learning, la plateforme qui permet aux entreprises de créer des formations et de piloter leur suivi par leurs collaborateurs. Avant ça, elle est passée par Netflix et Lyft, 2 boîtes américaines connues pour être extrêmement data-driven. 360Learning compte près de 2000 clients en Europe et aux US. Ils sont 400 salariés dont 80 ingénieurs. Marie nous parle d’un projet GenAI qui permet à leurs utilisateurs de créer des cours en quelques minutes qui est aujourd’hui live dans le produit.On aborde :🔥 Son parcours et son passage à San Francisco : Berkeley, Lyft, Netflix🔥 Les grandes phases du projet GenAI et l’usage de GPT-4🔥 Les challenges principaux : expérience utilisateur, personnalisation, métriques de succès…🔥 L'évolution du métier de Machine Learning Engineer.---❤️ PARTENAIRECe podcast est rendu possible par Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/---🎬 CHAPITRES00:00 Générique01:31 Intro05:14 Le projet GenAI développé par 360Learning10:22 Comment ils utilisent GPT-412:38 Les dernières features développées17:22 L'évolution du métier de Machine Learning Engineer19:17 Les challenges principaux : XP utilisateur, personnalisation…22:57 Le bilan24:14 Les next steps : nouveaux produits GenAI notamment pour améliorer l'XP côté élève25:12 Les questions de la fin (ressources, conseils...)---📚 RESSOURCES- Data Driven 101, le podcast de Marc Sanselme- Les meetups Generative AI Paris---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#117 - Eulidia : Tout comprendre sur les IA Génératives#110 - Back Market : Leur stratégie Data Science#102 - Databricks : Une stack unique pour l’Analytics et l’IA---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #121 - Lancer sa carrière en Data Science avec Natacha Njongwa Yepnga

    27:33
    Natacha Njongwa Yepnga est Senior Data Scientist et est actuellement Consultante à la Société Générale. Elle est surtout l’une des plus grandes influenceuses data en France avec +26 000 followers sur LinkedIn et +10 000 abonnés à sa chaîne Youtube LeCoinStat. Elle y partage du contenu sur des sujets techniques ou des conseils de carrière à destination des profils data.On aborde :🔥 Son parcours et ce qui la motive à créer du contenu🔥 Les différents métiers data et les études à suivre pour se former🔥 Sa vision sur le métier de Data Scientist : est-ce que le métier est saturé ?🔥 Ses recommandations pour bien se préparer aux entretiens d’embauche.---❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : bit.ly/47UthCv---🎬 CHAPITRES00:00 Générique01:40 Intro03:35 Quelles études pour travailler ou se reconvertir dans la data ?08:29 Les différents métiers de la data11:36 Est-ce que le métier de Data Scientist est saturé sur le marché aujourd'hui ?15:07 Vers quel type d'entreprise se diriger ?16:37 Comment préparer les entretiens d'embauche18:35 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESStatQuest de Josh StarmerMachine Learnia de Guillaume Saint-CirgueCassie KozyrkovWillis NanaKevin RosamontBenjamin EjzenbergThe Diary of a CEO de Steven BartlettLinchpin de Seth Godin---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#71 - Lancer sa carrière data#118 - Reconversion | De RH à Data Analyst#103 - Reconversion | De Responsable Études à Data Analyst---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---📹 DECOUVREZ DATAGEN SUR YOUTUBE ici