Partager

DataGen
#268 - Criteo : Déployer des algorithmes en temps réel à l'échelle (ML & GenAI)
Sarah Nogueira est Staff Machine Learning Lead chez Criteo, l'une des premières licornes françaises, spécialisée dans le marketing et le ciblage publicitaire sur les sites e-commerce. Elle dirige une équipe qui développe et met en production des modèles de Machine Learning dans le produit.
On aborde :
🔥 Le déploiement de leur premier LLM en production
🔥 Leur cycle de développement ML du prototype à la mise en production
🔥 Leur stack in-house et leurs plus gros enjeux : temps réel et qualité des résultas
🔥 Ses principaux challenges en temps que manager : vélocité, staffing, coordination
💪 VOUS AVEZ UN PROJET DATA ?
DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).
Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.
👉 Nous rencontrer ici
📚 RESSOURCES
- Le LinkedIn de Sarah
- Le blog de Criteo
- La newsletter The Batch de DeepLearning.AI
🎬 CHAPITRES
00:00 Son parcours
01:34 Le rôle de son équipe ML
04:46 1er LLM en production
06:16 Leur cycle de développement ML
16:15 Leurs principaux challenges
19:59 Ses reco de contenu
21:01 Ce qui l’a le plus fait progresser
🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER
#250 - Malt : Mettre en place une approche MLOps et LLMOps
#196 - Pigment : Monter l'équipe GenAI appliquée au Produit (Licorne, +230 millions levés)
#170 - Leboncoin : De la Data Science au ML Engineering
👋 PLUS DE CONTENU DATA ?
1/ Suivez-moi sur LinkedIn ici 🤳
2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌
3/ Découvrez le podcast en format vidéo sur YouTube ici 📹
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
1/ Abonnez-vous 🔔
2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
More episodes
View all episodes

#270 - Les outils de la Data Gouvernance avec Charlotte Ledoux
32:03|Charlotte Ledoux est une experte Data & AI Gouvernance, elle accompagne de très belles boîtes comme Pernod Ricard, Disney ou Printemps. En parallèle, elle crée du contenu sur LinkedIn sur ce sujet avec beaucoup de succès (+50K abonnés) et est identifiée par les leaders data comme l’experte n°1 sur la Data Gouvernance.On aborde :🔥 Le Data Catalog : rôle, solutions principales et comment structurer son benchmark🔥 La Data Quality : rôle, solutions principales et maturité actuelle des entreprises🔥 Le Semantic Layer : rôle et pourquoi on devrait le fusionner avec le Data Catalog pour alimenter les IA🔥 La consolidation du marché : CastorDoc racheté par Coalesce, Informatica racheté par Salesforce…💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici📚 RESSOURCES- Le LinkedIn de Charlotte- Sa newsletter- Son jeu en ligne The CDO Game- L'article de Peter Baumann sur la perspective du marché des Data Catalogs- Pour recevoir les 10 outils Data & IA à suivre en 2025, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 Qu'est-ce qu'un Data Catalog ?04:54 Les solutions principales07:05 Structurer son benchmark16:00 Qu'est-ce qu'un outil Data Quality ?17:40 Les solutions principales19:47 La maturité des entreprises22:35 Qu'est-ce qu'un Semantic Layer ?24:59 Le lien entre Semantic Layer et Data Catalog28:14 Les solutions principales29:06 La consolidation du marché30:47 Sa ressource préférée🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#254 - Les 5 tendances Data Gouvernance de 2026 avec Charlotte Ledoux#256 - Strategy Software : Accélérer le time-to-data avec un Semantic Layer Universel et la GenAI#144 - Mettre en place une Data Gouvernance avec Charlotte Ledoux (20K abonnés LinkedIn) 💪👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
#269 - Ex-Data Analyst, il est devenu Analytics Engineer chez Pierre Fabre
17:50|Guilhem Jolly était Data Analyst pendant deux ans avant de devenir Analytics Engineer. Il travaille actuellement chez Pierre Fabre, un des leaders pharmaceutiques français. On aborde :🔥 Pourquoi l’Analytics Engineering est le “meilleur des deux mondes” entre tech et business🔥 Comment il s'est formé et a décroché immédiatement 3 opportunités (BetClic, Elevate, Pierre Fabre)🔥 Les compétences clés qu’il a acquises : SQL robuste, dbt, architecture médaillon et orchestration🔥 Ses missions actuelles chez Pierre Fabre : rapports de performance, flux de données et prospective marché💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBirdDataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et touche une commission sur les inscriptions. 🙂📚 RESSOURCES - Le LinkedIn de Guilhem- Le LinkedIn de Mathias Frachon (recruteur tech, live data sur les salaires)- Le LinkedIn de Benjamin Dubreu- Pour recevoir les 100+ ressources préférées des Head of Data invités sur DataGen, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 Le parcours de Guilhem03:04 Le bootcamp qu’il a suivi07:04 Ses nouvelles compétences08:51 Ses missions chez Pierre Fabre11:37 L’importance des pairs12:03 Son conseil pour réussir la transition DA > AE15:16 Ses side projects16:46 Ses reco de contenu🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER #232 - Ex-Data Analyst, elle est devenue Analytics Engineer en freelance chez Back Market#217 - Ex-Data Analyst, il est devenu Analytics Engineer en freelance chez Lacoste#169 - Ex-Data Analyst, elle est passée Analytics Engineer en freelance👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
#267 - L’agentique accélère : quel impact pour l’équipe data ? Avec Blef
34:32|Christophe Blefari a été Head of Data Engineering, Staff Data Engineer et Head of Data dans dans des startups et des grands groupes et il a cofondé Nao, un agent IA open source pour l’analytics.On aborde :🔥 L’accélération de l’agentique en 2026 : l'autonomisation des agents, OpenClaw…🔥 L’impact sur l’équipe Data (Data Engineers, Data Analysts, Data Scientists...)🔥 L'impact sur le Buy Versus Build : est-ce que ça devient rentable de développer certains outils en interne ?🔥 Le Context Engineering et pourquoi les data catalogues ont raté le coche💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici📚 RESSOURCES- Le LinkedIn de Christophe Blefari- Sa newsletter Blef.fr- Sa boîte Nao- L’article I Taught My Dog to Vibe Code Games de Caleb Leak- Replay de leur meetup Agentic Analytics- Son épisode avec Alexis Blandin de Jolimoi- Pour recevoir les 10 outils Data & IA à suivre en 2025, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 L’accélération de l'agentique en 202603:49 L'impact sur les équipes Data18:11 Quelles boîtes sont matures ?21:13 L'impact sur le Buy vs Build29:59 Les reco de contenu de Blef🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#236 : Photoroom : Déployer une stratégie GenAI pour l’analytics et x15 sa vitesse de delivery#242 - On décrypte 4 tendances Data & IA de 2026 avec Blef#249 : On décrypte la fusion Fivetran x dbt avec Blef👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
🇪🇺 #266 - Flix: Leveraging data to scale operations
26:57|Manoj Raghavan is a Staff Data Strategist at Flix, the affordable travel tech scaleup based in Germany, solving technology for long-distance buses and trains. Flix operates in 40+ countries, has 5,000 employees, including around 100 data & AI experts.We cover :🔥 Their data organisation: decentralized and with no central data leadership🔥 One of the main projects he worked on to improve customer experience: bus partner classification🔥 Their stack: AWS, Snowflake, dbt, Power BI…🔥 One of their main current challenges: build vs. buy when it comes to AI tools📚 RESOURCES- Manoj’s LinkedIn profile- The book of book Chip Huyen Designing Machine Learning Systems- The book of book Chip Huyen AI Engineering🎬 CHAPTERS00:00 What is Flix?02:38 Manoj's journey06:28 The Data team organization10:43 One of his main projects16:35 Their stack19:02 Their main challenges21:17 Their next step23:40 Resources he recommends24:42 His career advice🤩 OTHER EPISODES YOU SHOULD LOVE#6 - HelloFresh: Building and scaling a Product Analytics culture#5 - N26: Building and scaling the Data team for Marketing#1 - BlaBlaCar : Managing 50 Data People with Manu, VP Data👋 MORE DATA CONTENT?1/ Follow me on LinkedIn here 🤳2/ Sign up for the newsletter (summaries, events) here 💌3/ Check out the podcast in video format on YouTube here 📹🎙 SUPPORT THE PODCAST FOR FREE1/ Subscribe 🔔2/ Leave a 5 stars review on Apple Podcasts here 🥰
#265 - Back Market : Construire un Data Model robuste et scaler l’Analytics Engineering
32:34|Matthieu Colin est Analytics Engineering Manager chez Back Market, la marketplace de produits reconditionnés présente dans 17 pays qui compte plus de 15M de clients.On aborde :🔥 La construction d'un data model robuste pour arrêter de “réinventer la roue” à chaque analyse🔥 Le passage d’un dbt “home-made” à dbt : tests de qualité, incremental et fondations pour scaler🔥 L’ouverture du data model à 35+ contributeurs : gouvernance, metadata et gestion du self-service🔥 La maîtrise des coûts BigQuery et la stabilisation de la stack grâce au monitoring et à la CI/CD💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBirdDataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et touche une commission sur les inscriptions. 🙂📚 RESSOURCES- Le LinkedIn de Matthieu- La newsletter du fondateur de dbt- La newsletter Blef.fr- Pour recevoir la liste des plus gros challenges des leaders data invités sur DataGen, inscrivez-vous à notre newsletter ici.🎬 CHAPITRES00:00 Le parcours de Matthieu02:08 Chantier #1 : Le Data Model03:31 La stack06:02 Chantier #2 : Ouvrir le data model08:52 Chantier #3 : Qualité et metadata13:48 Chantier #4 : Maîtriser les coûts16:59 Chantier #5 : Stabilité de la stack19:27 Leur organigramme data22:22 Leurs plus grosses difficultés25:17 Leurs prochaines étapes29:54 Les reco de contenu de Matthieu30:34 Son meilleur conseil🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#245 - Masterclass | Mettre en place dbt avec Matthieu Rousseau, CEO & Data Engineer chez Modeo#174 - Qonto : Adopter une approche Analytics Engineering & Self-Service#150 - Back Market : Re-centraliser l’équipe et la stratégie Data (organigramme, stack…)👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
Redif Top 10 : Informatica - Préparer ses données pour l’IA
23:30|Are Hegdal est un Expert Data Management. Il travaille chez Informatica depuis 5 ans et est dans la data depuis presque 20 ans. Informatica est un leader mondial du secteur du Data Management. Ils ont été rachetés 8 milliards de dollars par Salesforce en 2025.On aborde :🔥 La genèse et les grandes briques d’Informatica (Intégration, Vision 360°, Data Quality…)🔥 Leur positionnement sur le marché (plateforme globale, approche neutre, R&D…)🔥 2 cas d’usage Data & GenIA dans la Pharma et l’Assurance🔥 L’impact de la GenAI sur Informatica depuis quelques années❤️ PARTENAIRECe podcast est rendu possible par Informatica, leader mondial du Data Management utilisé par des grands groupes comme Sanofi, Apple mais aussi des plus petites comme Garance en France.👉 S’inscrire aux cafés de la data d’Informatica👉 Contacter Are sur LinkedIn📚 RESSOURCES- Le LinkedIn d'Are- Le podcast Business de McKinsey- Le podcast Business du BCG- L'édition spéciale "Les 40 chantiers Data & IA à lancer en 2025" de notre newsletter🎬 CHAPITRES00:00 Informatica en quelques mots02:07 Les grandes briques d’Informatica05:04 Son positionnement face aux concurrents08:51 Les types de clients10:21 2 cas d’usage : Pharma et Assurance17:10 L’impact de la GenAI sur Informatica20:32 Leurs webinars Data Management21:03 La reco de contenu d’Are🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#205 - La Lead Data Scientist de Pernod Ricard partage sa stratégie (orga, stack, projets)#168 - Comprendre les rôles clés de la Data Gouvernance avec Charlotte Ledoux (30K abonnés LinkedIn)#144 - Mettre en place une Data Gouvernance avec Charlotte Ledoux (20K abonnés LinkedIn)👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
Redif Top 10 : Gorgias - Mettre en place une approche Self-Service Analytics grâce aux IA Génératives
37:34|Elliot Trabac est Senior Data Analytics Engineering Manager chez Gorgias, la scaleup qui propose une plateforme d’IA conversationnelle permettant aux e-commerçants de mieux gérer leur support client. Aujourd’hui ils comptent plus de 15 000 clients.On aborde :🔥 Le contexte et le déploiement du Self-Service Analytics grâce aux GenAI🔥 Leur stack data (Dot Ai, Omni…)🔥 L’un des avantages clés du Self-Service🔥 L’organisation de l’équipe, les difficultés, etc.❤️ PARTENAIRECe podcast est rendu possible par Keyrus, le cabinet de conseil spécialisé sur la Data et l'IA.👉 Découvrir la masterclass Mettre en place une Data Analytics Factory👉 Recevoir leur livre blanc qui reprend l’approche présentée dans le détail👉 Contacter Brahim sur LinkedIn ou par mail : brahim.abdesslam@keyrus.com📚 RESSOURCES- Le LinkedIn d’Elliot- La chaîne YouTube de Dave Ebbelaar, fondateur de Datalumina🎬 CHAPITRES00:00 Générique00:28 Gorgias en quelques mots05:42 Le contexte autour du projet09:10 Comment il s’insère dans la stratégie Analytics ?13:23 L’outil utilisé15:50 Le déploiement19:59 Leur stack Self-Service Analytics & GenAI25:26 L’avantage clé du Self-Service Analytics : l’Observabilité27:13 L’organisation de l’équipe pour déployer ce projet32:06 Les difficultés qu’a rencontrées Elliot34:02 Les prochaines étapes pour ce projet34:49 Les questions de la fin (ressources, conseils…)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#178 - On décrypte 3 tendances Data de 2025 avec Christophe Blefari (aka Blef.fr)#158 - CastorDoc : Data Catalog + GenAI = Self-Service Analytics#90 - Ovrsea : Mettre en place une approche Self-Service💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semainesDataGen a lancé ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹
#264 - Gorgias : Déployer un agent IA au coeur du produit (15 ML Engineers & ML Analysts)
31:26|Firas Jarboui est Head of Machine Learning chez Gorgias, la scale-up qui propose une plateforme d'IA conversationnelle pour les e-commerçants. Ils ont plus de 15 000 clients et la scale-up a été valorisée plus de 700 millions de dollars lors de leur dernière levée de fonds en 2022.Firas va nous raconter comment l'arrivée des IA génératives a entraîné un repositionnement complet de Gorgias avec des fonctionnalités GenAI qui sont maintenant au cœur du produit.On aborde :🔥 Le repositionnement de Gorgias autour d’une IA conversationnelle🔥 Les 3 phases de développement : POC, refonte de l’architecture LLM & scale🔥 L’organisation de l’équipe et le nouveau rôle de Machine Learning Analyst🔥 La stack qu’ils utilisent et leurs plus gros challenges : qualité et feedback loops❤️ PARTENAIRECe podcast est rendu possible par Alteryx, l’outil aux 750 000 utilisateurs qui permet aux profils non techniques d’exploiter et de valoriser leurs données.👉 Découvrir l’épisode avec Jérôme Couzy, Customer Success Manager chez Alteryx👉 Découvrir leur guide pratique pour préparer ses données pour l’IA ici👉 Contacter Jérôme sur LinkedIn ou par mail : jerome.couzy@alteryx.com📚 RESSOURCES- Le LinkedIn de Firas- Les ressources Anthropic- Les ressources OpenAI- Pour recevoir Les plus gros challenges des leaders data invités sur DataGen, s'inscrire à la newsletter ici.🎬 CHAPITRES00:00 Le parcours de Firas 03:46 Gorgias avant l’IA générative05:36 Le contexte à l’arrivée des GenAI06:55 Chantier #1 : Chatbot support10:01 Chantier #2 : Chatbot sales15:24 Chantier #3 : Refonte archi LLM18:29 L’organisation de l’équipe22:45 Leur stack23:50 Leurs plus grosses difficultés26:30 Leurs prochaines étapes29:47 La reco de contenu de Firas30:13 Ce qui l'a le plus fait progresser🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#226 - Brevo : Monter l'équipe GenAI appliquée au Produit (Centaure, 189 millions ARR)#196 - Pigment : Monter l'équipe GenAI appliquée au Produit (Licorne, +230 millions levés)#192 - Gorgias : Mettre en place une approche Self-Service Analytics grâce aux IA Génératives👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰