Partager

DataGen
#252 - Sweep : Lancer le département Data & IA d'une startup (Stack, Self-Service & Agents IA)
Adèle Guillet est Data & AI Director chez Sweep, le logiciel de pilotage du quota carbone qui a levé 100 millions de dollars dans ses 2 premières années d’existence et qui accompagne déjà notamment L’Oréal, SNCF, Auchan ou Leroy Merlin.
Elle va nous raconter comment elle a lancé le département Data & IA.
On aborde :
🔥 Son parcours de Data Scientist à Head of Data en startup
🔥 La mise en place d’une Modern Data Stack (Snowflake, dbt, Fivetran, Metabase…)
🔥 La mise en place d’une approche Self-Service pragmatique (Data Champions, certified dashboards…)
🔥 Le déploiement de fonctionnalités IA dans le produit et la structuration de l’équipe IA (ML Engineer et AI Engineers “full full Stack”)
💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN
On a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.
📚 Découvrir le programme du bootcamp ici
🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBird
DataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et touche une commission sur les inscriptions. 🙂
📚 RESSOURCES
- Le LinkedIn de Adèle
- Le livre Radical Candor de Kim Scott
- Pour recevoir le dossier sur les plus gros challenges des leaders data invités sur DataGen, s'inscrire à la newsletter ici
🎬 CHAPITRES
00:00 Qu’est-ce que Sweep ?
02:03 Le parcours d’Adèle
02:46 Le contexte data & IA à son arrivée
04:06 Chantier #1 : Stack
05:59 Chantier #2 : Analytics
07:36 Chantier #3 : Agents IA
10:04 Orga de l’équipe Data & IA
11:22 Leurs plus grosses difficultés
14:38 Leurs prochaines étapes
15:12 Sa reco de contenu
15:28 Ce qu’elle aime dans la data
🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER
#218 - Fairly Made : Lancer le département Data d'une startup
#176 - Agorapulse : Structurer le département Data d’une startup
#132 - Joko : Lancer le département Data d'une startup
👋 PLUS DE CONTENU DATA ?
1/ Suivez-moi sur LinkedIn ici 🤳
2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌
3/ Découvrez le podcast en format vidéo sur YouTube ici 📹
🎙 SOUTENEZ LE PODCAST GRATUITEMENT
1/ Abonnez-vous 🔔
2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
More episodes
View all episodes

🇪🇺 #251 - N26: Building and scaling the Data team for Marketing
33:31|Mathias is Head of Data for Marketing at N26, the Berlin-based neobank valued at over $9 billion. He joined as a Senior Data Analyst in May 2020 and has since scaled the team to 12 people.We cover :🔥 His journey to becoming Head of Data for Marketing at N26🔥 His main projects: Marketing Mix Modeling, User Value Modeling, Data Governance & Data Quality🔥 The data stack at N26: AWS, Snowplow, dbt, Redshift, Metabase…🔥 His main challenges: scale-up volatility and the classic imposter syndrome📚 RESOURCES- Mathias’s LinkedIn profile- The book of Zhamak Dehghani Data Mesh : Delivering Data-Driven Value at Scale- The book of Joe Reis & Matt Housley Fundamentals of Data Engineering: Plan and Build Robust Data- The book of Gene Kim, Kevin Behr and George Spafford The Phoenix Project- The book of Gene Kim The DevOps Handbook- The book of Gene Kim The Unicorn Project- The book of Gene Kim, Jez Humble and Nicole Forsgren PhD Accelerate🎬 CHAPTERS00:00 Introduction to N2603:25 How he became Head of Data for Marketing at N2610:49 1st project: implementing a Marketing Mix Model17:36 2nd project: building a User Value Model20:57 3rd project: Data Governance & Quality23:37 The data stack at N2625:16 The biggest challenges29:29 What’s next: decision automation31:11 Mathias’s favorite resources32:14 Why he loves working in data🤩 OTHER EPISODES YOU SHOULD LOVE🇺🇸 #114 - BlaBlaCar : Managing 50 Data People with Manu, VP Data🇺🇸 #106 - Aircall: Adapting the Data Strategy to the slowing economic environment🇺🇸 #96 - Deezer : How I restructured the Business Analytics team and made it more Business-Focused 👋 MORE DATA CONTENT?1/ Follow me on LinkedIn here 🤳2/ Sign up for the newsletter (summaries, events) here 💌3/ Check out the podcast in video format on YouTube here 📹🎙 SUPPORT THE PODCAST FOR FREE1/ Subscribe 🔔2/ Leave a 5 stars review on Apple Podcasts here 🥰
#250 - Malt : Mettre en place une approche MLOps et LLMOps
39:15|Nicolas Mauti est Staff MLOps Engineer chez Malt, où il a été le premier MLOps de l’équipe. Malt c’est la plateforme leader du freelancing en Europe, qui met en relation des freelances avec des entreprises.Dans cet épisode, Nicolas revient sur son principal défi de ces dernières années : mettre en place et structurer une approche MLOps chez Malt, dans un contexte déjà mature côté data, puis l’adapter à l’arrivée massive des IA génératives.On aborde :🔥 Le profil de Nicolas et le contexte chez Malt qui nécessite un rôle MLOps🔥 Les fondations MLOps chez Malt : feature store, rationnalisation des pipelines ML, CI/CD & monitoring🔥 L’évolution du besoin MLOps avec l’arrivée des IA génératives🔥 La stack technique de Malt et les prochaines étapes de l’équipe📚 RESSOURCES- Le LinkedIn de Nicolas- Le blog Malt Engineering sur Medium- La communauté MLops- Pour recevoir le dossier sur les plus gros challenges des leaders data invités sur DataGen, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 Le parcours de Nicolas03:41 Le contexte à son arrivée05:14 Chantier #1 : Centralisation des features (aka Feature Store)08:05 Chantier #2 : Optimisation des pipelines ML et CI/CD10:34 Chantier #3 : Monitoring & alerting16:01 Comment l'arrivée des GenAI impacte les besoins MLOps18:39 Le premier projet LLMOps24:22 L’acculturation des équipes Engineering29:58 Leur stack MLOps34:20 Leurs prochaines étapes35:56 Sa recommandation de contenu36:54 Son meilleur conseil🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#170 - Leboncoin : De la Data Science au ML Engineering#211 - Brevo : Mettre en place une approche DataOps#234 - Malt : Déployer des assistants IA à l’échelle👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
#249 - On décrypte la fusion Fivetran x dbt avec Blef
26:27|Christophe Blefari est le créateur de la newsletter data blef.fr la plus connue en France. Il a été Head of Data, Head of Data Engineering et Staff Data Engineer dans des startups comme des grands groupes et est selon moi l'un des plus grands experts data en France. Récemment, il a cofondé nao Labs, un éditeur de code à destination des équipes data qui utilise l'IA.On aborde :🔥 La stratégie derrière la fusion Fivetran x dbt : créer un centre de gravité plus gros pour concurrencer les mastodontes🔥 L'impact sur les équipes Data : frustration de la communauté open source, positionnement enterprise…🔥 L’approche "one-stop shop” avec des rachats probables à venir (data catalog, orchestrateur…)🔥 Les news de dbt Coalesce : Open Semantic Interchange, Metric Flow en Open Source…💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBirdDataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et touche une commission sur les inscriptions. 🙂📚 RESSOURCES- Le LinkedIn de Christophe- Sa newsletter blef.fr- Sa boîte nao- L'article “Build Your Own Database”🎬 CHAPITRES00:00 Fusion dbt x Fivetran06:18 La stratégie du côté de dbt09:44 La stratégie du côté de Fivetran12:54 L’impact sur les équipe Data19:44 Quelles seront les synergies ?22:41 Les news clés de dbt Coalesce24:55 Sa ressource préférée🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#231 - On décrypte avec Blef : Sommets Snowflake et Databricks, ClickHouse, DuckDB, BigQuery #224 - Blef a passé 3 mois chez Y Combinator aux US#186 – On compare dbt & SQLMesh avec Christophe Blefari (aka Blef)👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
#248 - Ornikar : Structurer une approche Analytics Engineering (CI/CD, FinOps, Naming & Semantic Layer)
28:39|Bastien Caunègre est Head of Data Platform chez Ornikar. La scale-up qui a dépoussiéré l'auto-école en la rendant 100% en ligne et qui s’est récemment lancée dans l’assurance auto. Arrivé comme premier Analytics Engineer, il a déployé l’approche Analytics Engineering chez Ornikar et pilote aujourd’hui l’équipe Data Platform.On aborde :🔥 Les 1ères initiatives : CI/CD dbt, FinOps, naming conventions🔥 La construction d’un Semantic Layer dans dbt pour centraliser les métriques🔥 La structuration d’une gouvernance pour accompagner l’équipe Analytics (standards sur Notion, building committee…)🔥 Leur usage des GenAI et de l’automatisation : Dust pour le self-service analytics, n8n pour les workflows sur Git💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Regarder l’épisode 151 Devenir Analytics Engineer en 6 semaines avec DataBirdDataGen opère ce bootcamp Analytics Engineering en collaboration avec DataBird et touche une commission sur les inscriptions. 🙂📚 RESSOURCES - Le LinkedIn de Bastien- La newsletter Blef.fr- Pour recevoir les 100+ ressources préférées des Head of Data invités sur DataGen, s'inscrire à la newsletter ici🎬 CHAPITRES0:00 Son parcours02:23 L’orga de l’équipe Data02:56 L’approche Analytics Engineering05:00 Les 1ères actions12:01 La gouvernance13:41 Semantic Layer dans dbt19:29 Intégration de Dust24:32 Automatisations avec n8n26:25 Next steps26:56 Sa reco de contenu27:37 Son meilleur conseil🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER #225 - Qover : Structurer son Data Warehouse & Modéliser ses Données (dbt, Médaillon…)#216 - Datadog : Adopter une approche Analytics Engineering et Self-Service#154 - Doctolib : Adopter une approche Analytics Engineering et Self-Service👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
🇪🇺 #247 - Ex-VP of Product at Looker, he launched Omni, the challenger in Business Intelligence
34:21|Colin is the co-founder & CEO of Omni, the Business Intelligence tool that has seen rapid adoption over the past years. By 2025, Omni had raised $69 million and reached a valuation of $650 million. Many data leaders are now choosing to abandon their traditional BI tools in favor of Omni.We address :🔥 Why Colin left his role as VP of Product at Looker to build a new BI tool🔥 The Omni vision: reconciling enterprise BI governance with the flexibity of Excel and SQL🔥 AI for Analysis (”chat with your data”): what Omni did differently in its Semantic Layer to make it work🔥 The future of Data teams when anyone can do complex analyses in minutes❤️ SPONSORThis episode is made possible by Omni, the next-generation BI platform already used by many companies (Brevo, Photoroom, etc.).👉 Discover the demos📚 RESOURCES- Colin's LinkedIn- Jason Lemkin’s SaaStr blog- Dave Kellog’s Kellblog blog- Demos on the Omni website (Build in Public)🎬 CHAPTERS00:00 Colin’s career path01:37 Omni’s initial vision05:07 From Looker to Omni09:42 Why data leaders choose Omni15:53 AI for Analysis (”Chat with your data”): what Omni did differently in its Semantic Layer to make it work20:12 “Building in public” at Omni24:36 The evolution of data teams30:58 The specifics of the French market32:30 Colin’s resource recommendations33:13 What he likes most about data🤩 OTHER EPISODES YOU SHOULD LOVE#236 - Photoroom : Déployer une stratégie GenAI pour l’analytics et x15 sa vitesse de delivery#192 - Gorgias : Mettre en place une approche Self-Service Analytics grâce aux IA Génératives #184 - Brevo : Mettre en place de l’embedded analytics dans le Produit👋 MORE DATA CONTENT?1/ Follow me on LinkedIn here 🤳2/ Sign up for the newsletter (summaries, events) here 💌3/ Check out the podcast in video format on YouTube here 📹🎙 SUPPORT THE PODCAST FOR FREE1/ Subscribe 🔔2/ Leave a 5 stars review on Apple Podcasts here 🥰
Bilan DataGen 2025 : 350 000€ de CA, 45 000 écoutes mensuelles, 3 top épisodes et une grosse news
12:06|Voici le bilan 2025 et les nouveaux projets de 2026 pour DataGen ! 🔥🎬 CHAPITRES00:00 Intro01:25 Les performances03:20 Le top 3 épisodes05:06 Le chiffre d'affaires07:49 Grosse news10:39 Update perso🤩 LE TOP 3 DE 2025#179 - dbt : L’outil le plus adopté ? ⚙️#196 - Monter l’équipe GenAI d’une licorne#183 - BlaBlaCar : Adopter une approche “Staff” dans l’équipe Data👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
#246 - SNCF Connect & Tech : Leur stratégie Data
25:34|Angélique Bidault-Verliac est Chief Data & Performance Officer chez SNCF Connect & Tech, la filiale digitale de SNCF Voyageurs. Avant ça, elle était Chief Data Officer chez OUI.SNCF depuis 2018, ce qui lui donne un solide recul sur les enjeux data du groupe. Elle revient sur la stratégie data menée ces 4 dernières années.On aborde :🔥 Chantier #1 : re-structurer l’architecture Cloud pour absorber 1,5 milliard de visites par an🔥 Chantier #2 : déployer un plan de gouvernance à l’échelle du groupe🔥 Chantier #3 : mettre la donnée à disposition en temps réel🔥 Leurs plus gros challenges : trouver une vision technologique commune et embarquer les métiers💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici📚 RESSOURCES- Le LinkedIn d'Angélique- Le film "The Creator" de Gareth Edwards- Pour recevoir Les plus gros challenges des leaders data invités sur DataGen, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 Leur orga03:00 Le contexte data 03:50 Chantier #1 : Achitecture Cloud 07:34 Chantier #2 : Gouvernance 10:55 Chantier #3 : Temps réel13:38 Cas d’usage : la “rétrainspective”15:45 Leurs 3 plus grosses difficultés22:25 Leurs prochaines étapes23:18 Sa ressource préférée24:23 Son meilleur conseil🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#237 - ENGIE : Déployer la stratégie Data & IA dans l’Industrie#194 - Sanofi : Les 3 piliers de leur Stratégie Data & IA (cas d’usage, Data Mesh, Stack)#123 - Starburst : Accélérer l’accès au Data Lake et attaquer plusieurs sources en une requête👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
#245 - Masterclass | Mettre en place dbt avec Matthieu Rousseau, CEO & Data Engineer chez Modeo
22:03|Matthieu Rousseau est un expert en Data Engineering, sur le sujet de la Modern Data Stack et notamment sur dbt. Il a monté Modeo, l’agence spécialisée sur l’IA et le Data Engineering (dbt, Snowflake, Airflow, DLT, Databricks...).On aborde :🔥 Les étapes clés pour mettre en place dbt : choix open source vs cloud, structuration des projets, orchestration et observabilité🔥 Les 5 avantages de l'outil : cadre de travail, time to market, qualité des données, self-service BI et intégration dans la stack🔥 Ses inconvénients : structuration complexe sur les gros projets, limitations du SQL et learning curve pour les Data Analysts🔥 Les conseils de Matthieu : documentation & tests dès le début, séparation logiques techniques/métiers, usage de librairies open source❤️ PARTENAIRECet épisode est rendu possible par Modeo, l’agence spécialisée sur l’IA et le Data Engineering (dbt, Snowflake, Airflow, DLT, Databricks...).👉 Découvrir leur guide pour mettre en place dbt : ici👉 Contacter Matthieu sur LinkedIn👉 Contacter Matthieu par mail : matthieu@modeo.ai📚 RESSOURCES- Le LinkedIn de Matthieu- Le blog Start Data Engineering- Le guide de Modeo pour mettre en place dbt : ici- Le blog de Modeo🎬 CHAPITRES00:00 Qu’est-ce que dbt ?01:41 Pourquoi l’outil est autant utilisé ?03:44 Les étapes clés08:29 Les avantages14:50 Les inconvénients17:30 Les conseils de Matthieu20:24 Ses ressources préférées🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#203 - Masterclass | Mettre en place une Modern Data Stack avec Matthieu Rousseau#143 - Masterclass | Tout comprendre sur le DataOps avec Matthieu Rousseau#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰