Partager

DataGen
🇬🇧 #38 - Bonus 🎄 | Blef.fr : Writing the best Data Engineering newsletter
•
Christophe Blefari is Senior Data Engineer as a freelance and writer of the newsletter Blef.fr.
We go over :
🔥 His journey before launching the newsletter,
🔥 Why and how he writes it,
🔥 His main challenges as a Data Engineer,
🔥 His favorite contents, what he loves about data and a few tips.
---
📚 RESSOURCES
Fundamentals of Data Engineering: Plan and Build Robust Data Systems
The Data Warehouse Toolkit: The Definitive Guide to Dimensional Modeling, 3rd Edition
---
🎙 SUPPORT THE PODCAST FOR FREE
1/ Subscribe 🔔
2/ Leave 5 stars and a nice review on Apple Podcasts here 🥰
---
👋 MORE DATA CONTENT?
1/ Follow me on LinkedIn (tips/thoughts) here 🤳
2/ Subscribe to my newsletter (synthesis, ressources, events) here 💌
3/ Discover the podcast in video here 📹
More episodes
View all episodes
#187 - Palantir : La plateforme Data & IA pour les cas d’usage opérationnels
24:52|Agathe Verro est Deployment Lead chez Palantir, la plateforme d’IA et de Data qui permet de mettre en production à l’échelle des cas d’usage opérationnels. Pour ceux qui ne connaissent pas, l’entreprise est valorisée 200 milliards de dollars. Palantir travaille avec des acteurs clés dans divers secteurs comme l’automobile (Stellantis, Forvia), l’aéronautique (Airbus), le secteur bancaire et assurance, et l’industrie au sens large.On aborde :🔥 La mission de Palantir : concilier puissance de la Data & de l’IA avec sécurité & confidentialité des données🔥 Les grandes briques de la solution : ontologie, intégration, interfaces opérationnelles et gouvernance🔥 Leur positionnement par rapport aux autres plateformes Data & IA du marché🔥 Quelques use cases et l’impact des IA Génératives sur Palantir (marché, fonctionnalités…)❤️ PARTENAIRECe podcast est rendu possible par Palantir, la plateforme d’IA et de Data qui permet de mettre en production à l’échelle des cas d’usage opérationnels.👉 Contacter Agathe sur LinkedIn ou par mail : datagen@palantir.com📚 RESSOURCES- Le LinkedIn de Agathe- La vidéo Palantir for Scuderia Ferrari- Le reportage Social dilemma sur Netflix- Le livre Fake News de Julie Martinez🎬 CHAPITRES00:00 Générique00:31 Intro et parcours04:17 Les grandes briques de la solution08:40 Leur positionnement11:55 Quelques use cases15:45 Pourquoi les entreprises choisissent Palantir ?17:49 L’impact des GenAI sur Palantir21:06 Dernières questions (conseils, recommandation)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#172 - Mirakl : Intégrer la GenAI dans le Produit#146 - L’Oréal : Mettre en place une Stratégie GenAI#138 - Ovrsea : Gagner 50% de Productivité avec les GenAI💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateurCe bootcamp est opéré en collaboration avec DataBird et DataGen touche une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#186 - On compare dbt & SQLMesh avec Christophe Blefari (aka Blef)
27:08|Christophe Blefari est Staff Data Engineer, auteur de la newsletter data la plus connue au sein de l’écosystème français (Blef.fr), cofondateur de nao et surtout selon moi l’un des plus gros experts data en France.On aborde :🔥 Ce que proposent dbt et SQLMesh🔥 Comparaison des fonctionnalités clés🔥 Comparaison de l'expérience utilisateur, des communautés et du coût🔥 La rivalité naissante entre les fondateurs❤️ PARTENAIRECe podcast est rendu possible par Layer Data, le cabinet de conseil spécialisé sur la gouvernance et la qualité des données, qui accompagne les plus grandes multinationales comme LVMH, Coca-Cola ou EDF.👉 Contacter Rachid et son équipe sur LinkedIn ou par mail : rtighremt@layer-data.com et fblaise@layer-data.com📚 RESSOURCE- Le LinkedIn de Christophe et sa newsletter Blef.fr🎬 CHAPITRES00:00 Générique00:14 Intro02:36 Que proposent dbt et SQLMesh ?05:46 Comparaison des fonctionnalités clés11:05 SQLMesh, un outil plus technique ?14:08 Comparaison de l’expérience utilisateur et des communautés16:23 Comparaison des coûts21:23 La rivalité naissante entre les fondateurs de SQLMesh et dbt22:50 Zoom sur nao, l’outil que développe Blef🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#179 - dbt : L’outil le plus adopté de 2024 ?#178 - On décrypte 3 tendances Data de 2025 avec Christophe Blefari (aka Blef.fr) 🎁#161 - On décrypte avec Blef : Sa Data Horror Story d’Halloween et un update DataOps#141 - On décrypte avec Blef : GenAI & Self-Service, Metric Tree, ClickHouse💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateur👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#185 - Masterclass | Mettre en place un Data Catalog avec Rachid Tighremt
25:30|Rachid Tighremt est un expert Data Governance et plus spécifiquement sur la mise en place des Data Catalogs. Il a fondé Layer Data, le cabinet de conseil spécialisé sur la gouvernance et la qualité des données. Ils accompagnent les plus grandes multinationales comme LVMH, Coca-Cola ou EDF.🎬 CHAPITRES00:00 Générique00:37 Intro02:28 Pourquoi mettre en place un Data Catalog ?04:04 Les grandes étapes06:52 Mettre en place un benchmark10:49 Mettre en place un projet pilote13:52 Quelle organisation adopter ?16:00 Le plus gros challenge : déterminer l’usage en amont18:17 Pourquoi Rachid a décidé de se spécialiser sur le sujet20:08 L’impact des GenAI sur le Data Catalog22:51 Les questions de la fin (ressources, conseil)❤️ PARTENAIRECe podcast est rendu possible par Layer Data, le cabinet de conseil spécialisé sur la gouvernance et la qualité des données, qui accompagne les plus grandes multinationales comme LVMH, Coca-Cola ou EDF.👉 Contacter Rachid et son équipe sur LinkedIn ou par mail : rtighremt@layer-data.com et fblaise@layer-data.com📚 RESSOURCES- Le LinkedIn de Rachid- Le livre The Enterprise Data Catalog de Ole Olesen-Bagneux- Le podcast Decideo de Philippe Nieuwbourg🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#168 - Comprendre les rôles clés de la Data Gouvernance avec Charlotte Ledoux#158 - CastorDoc : Data Catalog + GenAI = Self-Service Analytics#111 - DataGalaxy : Mettre en place un Data Catalog💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On lance un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateurDataGen a lancé ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#184 - Brevo : Mettre en place de l’embedded analytics dans le Produit
24:51|Taha Bel Khayate est Lead Analytics Engineer chez Brevo, la plateforme de marketing automation qui permet notamment d’orchestrer ses campagnes d'emailing ou de SMS. La scaleup a acquis le statut de “centaure” après avoir dépassé les 100 millions d’euros de revenus annuels. On revient sur l’un des plus gros challenges de l’équipe Analytics Engineering.🎬 CHAPITRES00:00 Générique00:26 Intro 02:49 Contexte04:42 Le POC06:31 L'implémentation10:08 Leur stack data : dbt, BigQuery, Looker Explore11:21 les outils utilisés pour l'embedding13:37 leurs plus grosses difficultés15:59 Les prochaines étapes22:02 Les questions de la fin (ressources, conseil)❤️ PARTENAIRECe podcast est rendu possible par dbt Labs qui développe dbt, l’outil le plus mentionné sur le podcast.👉 Découvrir l’épisode avec Jeremy : #179 - dbt : L’outil le plus adopté de 2024 ?👉 Demander une démo : https://bit.ly/40kXh8K👉 Contacter Jeremy sur LinkedIn ou par mail : jeremy@dbtlabs.com📚 RESSOURCES- Le LinkedIn de Taha- Le LinkedIn de Maxime Beauchemin- Minding the Machine de Jeremy Adamson🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#154 - Doctolib : Adopter une approche Analytics Engineering et Self-Service#142 - Brevo : Structurer l’équipe Data d’un centaure#108 - Jellysmack : Adopter une approche Data Mesh💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On lance un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateurDataGen a lancé ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touche une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#183 - BlaBlaCar : Adopter une approche “Staff” dans l’équipe Data
32:12|Thomas Pocreau est Staff Machine Learning Engineer chez BlaBlaCar, la licorne de covoiturage et de transport que tout le monde connaît.On aborde :🔥 Pourquoi ils ont adopté une approche Staff dans l’équipe Data🔥 La différence entre un Staff et un Senior🔥 2 exemples de projets Staff🔥 Les plus gros challenges de la création du poste❤️ PARTENAIRECe podcast est rendu possible par dbt Labs qui développe dbt, l’outil le plus mentionné sur le podcast.👉 Contacter Jeremy sur LinkedIn ou par mail : jeremy@dbtlabs.com👉 Demander une démo : https://bit.ly/40kXh8K📚 RESSOURCES- Le LinkedIn de Thomas- Le Machine Learning Rules Book de Google- The Staff Engineer's Path de Tanya Reilly🎬 CHAPITRES00:00 Générique00:43 Intro 05:40 Le contexte 08:13 Senior vs Staff 11:06 1er projet : MLOps13:19 2ème projet : Analytics21:09 Le plus gros challenge de Thomas25:46 Les plus gros challenges de BlaBlaCar lors de la création du poste de Staff Data27:41 Les prochaines étapes pour l’approche staff chez BlaBlaCar29:07 Les questions de la fin (ressources, conseil)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#170 - Leboncoin : De la Data Science au ML Engineering#154 - Doctolib : Adopter une approche Analytics Engineering et Self-Service#150 - Back Market : Re-centraliser l’équipe et la stratégie Data (organigramme, stack…)🇬🇧 #114 - BlaBlaCar : Managing 50 Data People with Manu, VP Data💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On lance un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateurDataGen lance ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touchera une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#182 - Ex-Data Analyst, elle est devenue Analytics Engineer
21:23|Lara Guiral est Analytics Engineer chez Lenstra. Dans cet épisode dédié à l’Analytics Engineering, elle nous parle de sa transition de Data Analyst à Analytics Engineer et des avantages que ses nouvelles compétences lui apportent.On aborde :🔥 Son parcours : de Data Analyst à Analytics Engineer🔥 Pourquoi et comment elle s’est formée en Analytics Engineering ?🔥 Son retour d’expérience sur le bootcamp Analytics Engineering qu'elle a suivi🔥 Les ressources et conseils qui l’ont le plus aidée💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGENOn a lancé un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateur🤔 Des questions concernant le bootcamp ? Contactez-moi sur LinkedInDataGen a lancé ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touchera une commission sur les inscriptions. 🙂📚 RESSOURCES- Le LinkedIn de Lara- La newsletter Analytics Engineering Roundup- Les projets Data for Good- La communauté 50inTech- Le Slack #measure🎬 CHAPITRES00:00 Générique00:38 Intro et son parcours03:43 Pourquoi se spécialiser08:15 Comment elle s’est formée11:54 La charge de travail à prévoir13:25 Ce qu’elle a préféré dans le bootcamp 15:54 Comment ça l’a aidée à trouver un job18:28 Les questions de la fin (ressources, conseil)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#169 - Ex-Data Analyst, elle est passée Analytics Engineer en freelance#151 - Devenir Analytics Engineer en 6 semaines avec DataBird et DataGen#91 - Spendesk : Adopter l'approche Analytics Engineering👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#181 - Olympique de Marseille : L’ex-Head of Data partage sa stratégie Data
23:59|Jessy Hanzo est l’ex-Head of Data & Digital à l'Olympique de Marseille, le club de foot emblématique.On aborde :🔥 Les 2 gros enjeux data : Business et Sportif🔥 L’organisation de l’équipe Data et un exemple de projet🔥 Leur stack data : AWS, Redshift, dbt, Microsoft Power BI, Hightouch, Splio🔥 Le plus gros challenge de Jessy : scaler l’équipe Data❤️ PARTENAIRECe podcast est rendu possible par dbt Labs qui développe dbt, l’outil le plus mentionné sur le podcast.👉 Découvrir l'épisode avec Jeremy de dbt Labs👉 Contacter Jeremy sur LinkedIn ou par mail : jeremy@dbtlabs.com👉 Demander une démo📚 RESSOURCES- Le LinkedIn de Jessy- A Brief History of Humankind de Yuval Noah Harari🎬 CHAPITRES00:00 Générique00:35 Intro 03:55 Les 2 gros enjeux data09:42 L’organisation de l’équipe Data12:16 Leur stack data15:43 Zoom sur leurs chantiers data18:25 Le plus gros challenge de Jessy19:36 Leurs prochaines étapes en Data20:50 Les questions de la fin (ressources, conseil)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#164 - Jeux Olympiques : Améliorer la performance des athlètes avec la Data & l’IA#60 - Decathlon : Implémenter une nouvelle stratégie Analytics#46 : Gouvernement : Monter la cellule data de l'Élysée💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#180 - Qonto : Déployer des projets Data Science appliqués à la décision
30:24|Nicolas Augusti est Senior Data Scientist chez Qonto, la banque en ligne des PME et des indépendants, et également l’une des plus belles licornes françaises. La spécificité de l'équipe Data Science chez Qonto, c'est qu'elle fait de la data science appliquée à la décision.On aborde :🔥 Les chantiers de l’équipe Data Science chez Qonto : Mix Marketing Modeling, prévisions financières, pricing…🔥 Leur méthodologie : Value Analysis, Exploration, Modélisation, Communication, Documentation🔥 Les plus grosses difficultés : créer des modèles qui intègrent les changements liés au scale de l’entreprise et s’assurer que les projets aboutissent à des décisions et aient un impact sur le Business🔥 Les prochaines étapes de l’équipe : spécialiser l’équipe par stakeholders, se concentrer sur la rétention des clients.❤️ PARTENAIRECe podcast est rendu possible par CastorDoc, le Data Catalog qui propose aussi une solution de Self-Service Analytics (”Text-to-Insight”).👉 Contacter Tristan sur LinkedIn ou par mail : tristan@castordoc.com👉 Recevoir le benchmark avec tous les outils Self-Service Analytics identifiés et testés par Tristan et son équipe📚 RESSOURCES- Le LinkedIn de Nicolas- La chaîne YouTube StatQuest🎬 CHAPITRES00:00 Générique00:40 Intro 05:13 Les chantiers08:15 Les projets actuels11:05 Leur méthodologie20:33 Leurs plus grosses difficultés25:02 Leurs prochaines étapes27:12 Les questions de la fin 🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#174 - Qonto : Adopter une approche Analytics Engineering & Self-Service#136 - Qonto : Scaler le département Data d’une licorne#110 - Back Market : Leur stratégie Data Science💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰#179 - dbt : L’outil le plus adopté de 2024 ?
30:43|Jeremy Cohen est Principal Product Manager chez dbt, la solution de transformation souvent mentionnée sur le podcast. On en a parlé avec des 10aines de boîtes : BlaBlaCar, Doctolib mais aussi des plus grosses boîtes comme Decathlon.🎬 CHAPITRES00:00 Générique00:32 Intro03:27 La genèse de dbt08:51 dbt aujourd’hui14:54 Ses facteurs de succès17:13 L’impact de la GenAI sur dbt21:19 Les autres tendances : Iceberg, accessibilité, Semantic Layer28:02 Les questions de la fin (ressources, conseil)❤️ PARTENAIRECe podcast est rendu possible par dbt Labs qui développe dbt, l’outil le plus mentionné sur le podcast.👉 Contacter Jeremy sur LinkedIn ou par mail : jeremy@dbtlabs.com👉 Demander une démo : https://bit.ly/40kXh8K📚 RESSOURCES- Le LinkedIn de Jeremy Cohen- Le Roundup de dbt🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#176 - Agorapulse : Structurer le département Data d’une startup#141 - On décrypte avec Blef : GenAI & Self-Service, Metric Tree, ClickHouse, progresser en tant que DE#129 - BlaBlaCar : Scaler l’impact de l'équipe Data Engineering💪 DEVENIR ANALYTICS ENGINEER AVEC DATABIRD ET DATAGEN On lance un bootcamp spécialisé sur l’Analytics Engineering en collaboration avec DataBird.📚 Découvrir le programme du bootcamp ici🎙 Ecouter l’épisode #151 Devenir Analytics Engineer en 6 semaines avec Alexandre le fondateurDataGen lance ce bootcamp Analytics Engineering en collaboration avec DataBird et donc touchera une commission sur les inscriptions. 🙂👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰