Partager

cover art for #246 - SNCF Connect & Tech : Leur stratégie Data

DataGen

#246 - SNCF Connect & Tech : Leur stratégie Data

Angélique Bidault-Verliac est Chief Data & Performance Officer chez SNCF Connect & Tech, la filiale digitale de SNCF Voyageurs. Avant ça, elle était Chief Data Officer chez OUI.SNCF depuis 2018, ce qui lui donne un solide recul sur les enjeux data du groupe. Elle revient sur la stratégie data menée ces 4 dernières années.


On aborde :


🔥 Chantier #1 : re-structurer l’architecture Cloud pour absorber 1,5 milliard de visites par an

🔥 Chantier #2 : déployer un plan de gouvernance à l’échelle du groupe

🔥 Chantier #3 : mettre la donnée à disposition en temps réel

🔥 Leurs plus gros challenges : trouver une vision technologique commune et embarquer les métiers


💪 VOUS AVEZ UN PROJET DATA ?


DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).

Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.


👉 Nous rencontrer ici


📚 RESSOURCES


- Le LinkedIn d'Angélique

- Le film "The Creator" de Gareth Edwards

- Pour recevoir Les plus gros challenges des leaders data invités sur DataGen, s'inscrire à la newsletter ici


🎬 CHAPITRES


00:00 Leur orga

03:00 Le contexte data 

03:50 Chantier #1 : Achitecture Cloud 

07:34 Chantier #2 : Gouvernance 

10:55 Chantier #3 : Temps réel

13:38 Cas d’usage : la “rétrainspective”

15:45 Leurs 3 plus grosses difficultés

22:25 Leurs prochaines étapes

23:18 Sa ressource préférée

24:23 Son meilleur conseil


🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER


#237 - ENGIE : Déployer la stratégie Data & IA dans l’Industrie

#194 - Sanofi : Les 3 piliers de leur Stratégie Data & IA (cas d’usage, Data Mesh, Stack)

#123 - Starburst : Accélérer l’accès au Data Lake et attaquer plusieurs sources en une requête


👋 PLUS DE CONTENU DATA ?


1/ Suivez-moi sur LinkedIn ici 🤳

2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌

3/ Découvrez le podcast en format vidéo sur YouTube ici 📹


🎙 SOUTENEZ LE PODCAST GRATUITEMENT


1/ Abonnez-vous 🔔

2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰

More episodes

View all episodes

  • Bilan DataGen 2025 : 350 000€ de CA, 45 000 écoutes mensuelles, 3 top épisodes et une grosse news

    12:06|
    Voici le bilan 2025 et les nouveaux projets de 2026 pour DataGen ! 🔥🎬 CHAPITRES00:00 Intro01:25 Les performances03:20 Le top 3 épisodes05:06 Le chiffre d'affaires07:49 Grosse news10:39 Update perso🤩 LE TOP 3 DE 2025#179 - dbt : L’outil le plus adopté ? ⚙️#196 - Monter l’équipe GenAI d’une licorne#183 - BlaBlaCar : Adopter une approche “Staff” dans l’équipe Data👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #245 - Masterclass | Mettre en place dbt avec Matthieu Rousseau, CEO & Data Engineer chez Modeo

    22:03|
    Matthieu Rousseau est un expert en Data Engineering, sur le sujet de la Modern Data Stack et notamment sur dbt. Il a monté Modeo, l’agence spécialisée sur l’IA et le Data Engineering (dbt, Snowflake, Airflow, DLT, Databricks...).On aborde :🔥 Les étapes clés pour mettre en place dbt : choix open source vs cloud, structuration des projets, orchestration et observabilité🔥 Les 5 avantages de l'outil : cadre de travail, time to market, qualité des données, self-service BI et intégration dans la stack🔥 Ses inconvénients : structuration complexe sur les gros projets, limitations du SQL et learning curve pour les Data Analysts🔥 Les conseils de Matthieu : documentation & tests dès le début, séparation logiques techniques/métiers, usage de librairies open source❤️ PARTENAIRECet épisode est rendu possible par Modeo, l’agence spécialisée sur l’IA et le Data Engineering (dbt, Snowflake, Airflow, DLT, Databricks...).👉 Découvrir leur guide pour mettre en place dbt : ici👉 Contacter Matthieu sur LinkedIn👉 Contacter Matthieu par mail : matthieu@modeo.ai📚 RESSOURCES- Le LinkedIn de Matthieu- Le blog Start Data Engineering- Le guide de Modeo pour mettre en place dbt : ici- Le blog de Modeo🎬 CHAPITRES00:00 Qu’est-ce que dbt ?01:41 Pourquoi l’outil est autant utilisé ?03:44 Les étapes clés08:29 Les avantages14:50 Les inconvénients17:30 Les conseils de Matthieu20:24 Ses ressources préférées🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#203 - Masterclass | Mettre en place une Modern Data Stack avec Matthieu Rousseau#143 - Masterclass | Tout comprendre sur le DataOps avec Matthieu Rousseau#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #244 - Qonto : Industrialiser sa Data Platform (Obvervabilité, Data Contracts, Automatisation, Self-Service)

    42:38|
    Victor Cumer est Data Engineering Team Lead chez Qonto, la solution bancaire en ligne pour les PME et les indépendants qui est aussi l'une des plus belles licornes françaises. Avant de rejoindre Qonto, Victor était Head of Data Platform chez Veepee, une autre licorne française.On aborde :🔥 L’objectif de Victor en arrivant : stabiliser et scaler la Data Platform🔥 Ses 4 chantiers clés : Observabilité, Data Contracts, Automatisation & Self-Service🔥 Les difficultés : faire adhérer la nouvelle vision à l’équipe, faciliter l’adoption des utilisateurs🔥 Les prochaines étapes : intégrer des solutions autour de la gouvernance des données💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici📚 RESSOURCES- Le LinkedIn de Victor- Le livre Deciphering Data Architectures de James Serra- Pour recevoir le dossier sur les plus gros challenges des leaders data invités sur DataGen, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 Le contexte à son arrivée02:34 Objectif : Stabiliser la plateforme04:01 Chantier #1 : Observabilité07:12 Chantier #2: Data Contracts17:21 Chantier #3 : Automatisation21:06 Chantier #4 : Self-Service28:19 La stack chez Qonto31:33 Les plus grosses difficultés36:30 Les prochaines étapes38:43 Ses reco de contenu41:05 Pourquoi il aime la data🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#225 - Qover : Structurer son Data Warehouse & Modéliser ses Données (dbt, Médaillon…)#211 - Brevo : Mettre en place une approche DataOps#84 - Veepee : Utiliser les Data Contracts pour scaler sa Data Platform👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • Redif Top 3 : BlaBlaCar - Adopter une approche “Staff” dans l’équipe Data

    32:12|
    Thomas Pocreau est Staff Machine Learning Engineer chez BlaBlaCar, la licorne de covoiturage et de transport que tout le monde connaît.On aborde :🔥 Pourquoi ils ont adopté une approche Staff dans l’équipe Data🔥 La différence entre un Staff et un Senior🔥 2 exemples de projets Staff🔥 Les plus gros challenges de la création du poste❤️ PARTENAIRECe podcast est rendu possible par dbt Labs qui développe dbt, l’outil le plus mentionné sur le podcast.👉 Contacter Jeremy sur LinkedIn ou par mail : jeremy@dbtlabs.com👉 Demander une démo : https://bit.ly/40kXh8K📚 RESSOURCES- Le LinkedIn de Thomas- Le Machine Learning Rules Book de Google- The Staff Engineer's Path de Tanya Reilly🎬 CHAPITRES00:00 Générique00:43 Intro05:40 Le contexte08:13 Senior vs Staff11:06 1er projet : MLOps13:19 2ème projet : Analytics21:09 Le plus gros challenge de Thomas25:46 Les plus gros challenges de BlaBlaCar lors de la création du poste de Staff Data27:41 Les prochaines étapes pour l’approche staff chez BlaBlaCar29:07 Les questions de la fin (ressources, conseil)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#170 - Leboncoin : De la Data Science au ML Engineering#154 - Doctolib : Adopter une approche Analytics Engineering et Self-Service#150 - Back Market : Re-centraliser l’équipe et la stratégie Data (organigramme, stack…)🇬🇧 #114 - BlaBlaCar : Managing 50 Data People with Manu, VP Data💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On lance un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semainesDataGen lance ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touchera une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • Redif Top 3 : Pigment - Monter l'équipe GenAI appliquée au Produit (Licorne, +230 millions levés)

    29:46|
    Samya est Generative AI Research Lead chez Pigment, la nouvelle licorne française qui a levé +230 millions de dollars.On aborde :🔥 La genèse de l’équipe GenAI et sa stratégie🔥 Deux exemples de projets GenAI appliqués au Produit🔥 L’organisation de l’équipe et leur architecture technique (OpenAI, LangChain, Langfuse…)🔥 La plus grosse difficulté : trouver le bon équilibre performance x latence💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer📚 RESSOURCES- Le LinkedIn de Samya- L'épisode DeepSeek, China, OpenAI, NVIDIA, xAI, TSMC, Stargate, and AI Megaclusters du podcast de Lex Fridman- La newsletter AlphaSignal🎬 CHAPITRES00:00 Pigment en deux mots01:53 Le parcours de Samya03:47 La genèse de l’équipe GenAI et leur stratégie06:33 Les 2 exemples de projets08:14 L’organisation de l’équipe11:17 L'architecture technique (OpenAI, LangChain, Landfuse…)16:53 Leur plus grosse difficulté : l’équilibre performance x latence22:25 Leurs prochaines étapes25:21 Les dernières questions (recommandations, conseil)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#159 - Malt : Mettre en place un assistant IA (Dust, Gemini…)#148 - Ledger : Leurs 6 projets GenAI en production#146 - L’Oréal : Mettre en place une Stratégie IA Génératives#127 - Doctolib : Déployer une stratégie IA Générative 👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • Redif Top 3 : dbt, l’outil le plus adopté ?

    30:43|
    Jeremy Cohen est Principal Product Manager chez dbt, la solution de transformation souvent mentionnée sur le podcast. On en a parlé avec des 10aines de boîtes : BlaBlaCar, Doctolib mais aussi des plus grosses boîtes comme Decathlon.🎬 CHAPITRES00:00 Générique00:32 Intro03:27 La genèse de dbt08:51 dbt aujourd’hui14:54 Ses facteurs de succès17:13 L’impact de la GenAI sur dbt21:19 Les autres tendances : Iceberg, accessibilité, Semantic Layer28:02 Les questions de la fin (ressources, conseil)❤️ PARTENAIRECe podcast est rendu possible par dbt Labs qui développe dbt, l’outil le plus mentionné sur le podcast.👉 Contacter Jeremy sur LinkedIn ou par mail : jeremy@dbtlabs.com👉 Demander une démo : https://bit.ly/40kXh8K📚 RESSOURCES- Le LinkedIn de Jeremy Cohen- Le Roundup de dbt🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#176 - Agorapulse : Structurer le département Data d’une startup#141 - On décrypte avec Blef : GenAI & Self-Service, Metric Tree, ClickHouse, progresser en tant que DE#129 - BlaBlaCar : Scaler l’impact de l'équipe Data Engineering💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On lance un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semainesDataGen lance ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touchera une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #243 - Carrefour : Leur stratégie agentique

    33:52|
    Arthur Feger est Director of AI & Analytics chez Carrefour. Après six ans chez Ekimetrics, il a rejoint Carrefour pour diriger les chantiers data et IA pour l'e-commerce et le marketing. Il s'est intéressé très tôt aux IA génératives et a notamment construit le chatGPT interne de Carrefour. Maintenant, c'est lui qui porte la vision de l'IA agentique chez Carrefour.On aborde :🔥 Les agents à destination de l’externe : agent pour faire ses courses, service client…🔥 Leur stratégie pour déployer des agents pour l’interne : approche Self-Service et agents complexes🔥 Les outils utilisés et l’organisation pour déployer leurs agents : Data Scientists, Software Engineers…🔥 Leurs plus grosses difficultés : UX et déploiement d’agents par des profils non techniques❤️ PARTENAIRECet épisode est rendu possible par Arcane, le cabinet de conseil spécialisé sur la stratégie data appliquée au marketing qui travaille notamment avec Leroy Merlin, Decathlon ou encore Europcar Mobility Group.👉 Ecouter l'épisode Quelle stratégie data adopter pour scaler sa performance marketing ? avec Denis👉 Recevoir l'article rédigé par Arcane pour connaître la méthode, les outils et l’équipe à mettre en place ici👉 Contacter Denis sur LinkedIn ou par mail : denis@wearcane.com📚 RESSOURCES- Le LinkedIn de Arthur- La chaîne YouTube de Andrej Karpathy- Le cours Structuring Machine Learning Projects de Andrew Ng🎬 CHAPITRES00:00 Le contexte IA de Carrefour04:04 Les initiatives agentiques08:15 L’agentique appliquée au service client13:49 La stratégie agentique pour l’interne18:28 Un agent IA pour l'expansion des magasins22:46 Leur stack IA agentique24:39 Leur organisation27:10 Leurs plus grosses difficultés31:57 Ses recommandations de contenu32:43 Ses conseils pour progresser🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#234 - Malt : Déployer des assistants IA à l’échelle#233 - Carrefour : Déployer la stratégie IA Générative du Groupe#197 - Salesforce : Déployer des agents IA dans le Retail avec Agentforce👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #242 - On décrypte 4 tendances Data & IA de 2026 avec Blef

    42:43|
    Christophe Blefari est le créateur de la newsletter data Blef.fr la plus connue en France. Il a été Head of Data, Head of Data Engineering et Staff Data Engineer dans des startups et des grands groupes et est selon moi l'un des plus grands experts data en France. Récemment, il a cofondé Nao, un éditeur de code à destination des équipes Data qui utilisent l'IA.On décrypte 4 tendances Data & IA de 2026.On aborde :🔥 La GenAI pour la Data Analyse : “chat with your data”, état des lieux, semantic layer🔥 La GenAI pour le Data Engineering : “chat with your Modern Data Stack”, MCP, impacts sur l’équipe Data🔥 La GenAI “en production” : 95% des projets ne sont pas en production, limites technologiques, besoins en AI Engineers🔥 Le scale des Assistants IA en interne : enjeux différents (adoption, formation, communauté, automatisation & no code)📚 RESSOURCES- Le LinkedIn de Christophe Blefari- Sa newsletter Blef.fr- Sa boîte Nao- Le LinkedIn de Naïm Kosayyer (Selfr) - L'étude MIT sur les projets GenAI - Pour recevoir la liste des 10 outils Data & IA à suivre, s'inscrire à la newsletter ici🎬 CHAPITRES00:00 “Chat with your data”13:59 “Chat with your Modern Data Stack”22:50 L’impact sur l’équipe Data27:51 La GenAI “en production”36:20 Le scale des assistants IA🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMERLes épisodes avec Malt, Gorgias, Pigment, Mirakl, Decathlon, Doctolib et Photoroom.💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer ici👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹