Partager

cover art for #17 - Data For Good : Passer à l'action et accélérer des projets à impact

DataGen

#17 - Data For Good : Passer à l'action et accélérer des projets à impact

Lou Welgryn et Théo Alves Da Costa sont Co-Présidents de Data For Good, l'association qui met en relation 3000 bénévoles issus du milieu de la tech (ex : profils data, designers, développeurs, etc.) avec des associations, des ONG ou des porteurs de projets à impact.


Data For Good a été lancé en 2014 et propose des sessions d'accélération. Plus de 100 projets ont déjà pu bénéficier de ce programme dont notamment Open Food Facts, l'association qui développe la base de données utilisée par l'application Yuka.


Dans cet épisode, Lou et Théo nous parlent notamment de la genèse de l'association, de quelques projets et des challenges qu'ils rencontrent.


---


🎙 SOUTENEZ LE PODCAST GRATUITEMENT


1/ Abonnez-vous 🔔

2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰


---


👋 PLUS DE CONTENU DATA ?


1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌

3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹

More episodes

View all episodes

  • #130 - Comment l’ex-Head of Data Science & Analytics de Veepee structure le département Data de Choose

    37:36
    📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin : ICI 📆Marie Crappe est Head of Data chez Choose, l’application qui propose des produits de qualité (made in France, naturels, faits main...).Cet épisode est le 2nd d’une nouvelle série dont l’objectif est d’inviter des Head of Data qui ont déjà monté ou structuré une équipe Data et qui recommencent dans une plus petite structure. Aujourd’hui Marie nous parle de la structuration du département Data chez Choose après avoir dirigé une équipe de 30 personnes chez Veepee.🎬 CHAPITRES00:00 Générique01:45 Intro05:07 Le contexte avant l’arrivée de Marie09:51 L’approche de Marie (People Process Tools)11:51 Les outils de la Modern Data Sack utilisés (Airbyte, dbt, BigQuery ...)14:44 L’orga de l’équipe17:06 Comment elle priorise les projets20:18 Ses plus gros challenges23:34 Les next steps de l’équipe25:11 Sa philosophie de l'Analytics : vers le self-service ?27:59 Les IA génératives chez Choose33:06 Les questions de la fin (ressources, conseils...)❤️ PARTENAIRECe podcast est rendu possible par Popsink, la plateforme d'intégration et de traitement de données en temps réel.👉 Contacter Benjamin sur Linkedin👉 Découvrir l’outil📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin sur le temps réel📚 RESSOURCES- Coûts et décisions de Carla Mendoza- Le réseau Tech Rocks🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#126 - Comment l’ex-Head of Data de Lydia monte le département Data chez May#50 - Ledger : Monter le département Data d'une licorne#25 - Deezer : Lancer le département data d'une licorne💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast sur YouTube ici 📹
  • #129 - BlaBlaCar : Scaler l’impact de l'équipe Data Engineering

    26:38
    📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin : ICI 📆Thibault Ambard est Data Engineering Manager chez BlaBlaCar, la plateforme de transports partagés (voiture et bus) leader en Europe avec 20 millions d’utilisateurs en France. Aujourd’hui il vient nous parler de la réorganisation et des nouveaux outils qu’ils ont mis en place pour scaler l’impact de l’équipe.On aborde :🔥 Le contexte de départ côté Data Engineering (manque d’ownership, difficulté à prioriser…)🔥 Leur réorganisation par squad inspirée du Data Mesh et comment elle résout ces problèmes🔥 L’adaptation de la stack à la nouvelle organisation avec notamment la mise en place de dbt🔥 Les nouvelles difficultés pour mener des projets transverses (ex: pratiques de Software Engineering).---❤️ PARTENAIRECe podcast est rendu possible par Popsink, la plateforme d'intégration et de traitement de données en temps réel.👉 Contacter Benjamin sur Linkedin ou découvrir l’outil ici.📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin ICI---📚 RESSOURCES- An Elegant Puzzle de Will Larson- Le code a changé- Christophe Blefari fait partie du Collectif de freelance DataGen, contactez-nous pour travailler avec lui---🎬 CHAPITRES00:00 Générique01:30 Intro03:27 Le contexte autour de la réorganisation04:54 L’orga aujourd’hui06:42 Comment la réorg a résolu les problèmes initiaux11:20 L’adaptation de la stack17:36 Les étapes clés de la mise en place de dbt20:41 Les principales difficultés22:00 Les prochaines étapes pour l'équipe Data24:09 Les questions de la fin (ressources, conseils...)---🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#112 - MyLight Systems : Migrer vers une Modern Data (& AI) Stack avec Databricks#102 - Databricks : Une stack unique pour l’Analytics et l’IA---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?Suivez-moi sur LinkedIn 🤳
  • #128 - Le temps réel, grande tendance de 2024 avec Benjamin Djidi, CEO @Popsink

    20:20
    📆 S’inscrire au webinar qu’on organise le 3 septembre à 12h avec Benjamin : ICI 📆Benjamin Djidi est le CEO de Popsink, la plateforme d'intégration et de traitement de données en temps réel. Fin 2023, j’ai enregistré un épisode sur les tendances data de 2024 avec Christophe Blefari (alias Blef). Une des plus grosses tendances de l’année est le temps réel et Blef m’avait parlé d’une nouvelle solution : Popsink. J’ai donc invité Benjamin sur le podcast pour en savoir plus.On aborde :🔥 Le parcours de Benjamin et la genèse de Popsink🔥 Le cas d’usage type et la différence avec un ETL “classique” (Fivetran, Airbyte, Rivery…)🔥 Les 2 atouts du temps réel : faible latence et baisse des coûts🔥 Pourquoi le temps réel est particulièrement adopté en 2024 ?---❤️ PARTENAIRECe podcast est rendu possible par Popsink, la plateforme d'intégration et de traitement de données en temps réel.👉 Contacter Benjamin sur Linkedin ou découvrir l’outil ici.---🎬 CHAPITRES00:00 Générique01:02 Intro03:04 Les cas d'usage type03:54 La différence avec un ETL “classique”11:03 Pourquoi le temps réel est particulièrement adopté en 2024 ?15:36 Les questions de la fin (ressources, conseils...)---📚 RESSOURCES- La newsletter de Blef- La newsletter de Yaroslav Tkachenko, ex-Staff Data Engineer @Shopify et Principal Software Engineer @GoldSky- Les articles d’Hubert Dulay---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#102 - Databricks : Une stack unique pour l’Analytics et l’IA#100 - On décrypte 3 tendances data de 2024 avec Christophe Blefari (aka Blef.fr) 🎁#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast sur YouTube ici 📹
  • #127 - Doctolib : Déployer une stratégie IA Générative

    35:08
    Nacim Rahal est Senior Director Data & AI chez Doctolib, la licorne qui propose une plateforme de prise de rendez-vous avec des médecins et qui permet également de faire de la téléconsultation.On aborde :🔥 La stratégie GenAI de Doctolib (la genèse, l’approche, les use cases…)🔥 DoctoGPT (aka leur ChatGPT interne) et le projet Medical Assistant🔥 Leur organisation pour déployer ces projets et l’impact sur la stack🔥 Leur plus gros challenge et les prochaines étapes---❤️ PARTENAIRECe podcast est rendu possible par Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/---🎬 CHAPITRES00:00 Générique01:40 Introduction06:22 La genèse GenAI chez Doctolib12:22 Zoom sur DoctoGPT (ChatGPT interne)15:07 Zoom sur Medical Assistant (Core Product)18:12 Leur organisation pour déployer ces projets GenIA20:01 L’approche “start-up”21:17 L'impact sur l'équipe tech et la stack data25:32 Les plus gros challenges GenAI28:10 Les next steps sur les sujets GenAI29:32 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESLe podcast Acquired et en particulier les 3 épisodes avec Nvidia---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#117 - Masterclass | Tout comprendre sur les IA Génératives avec Benjamin Cohen-Lhyver#115 - Doctolib : Scaler sa Data Visualisation auprès de 2000 utilisateurs#11 - Doctolib : Accélérer la mise à disposition des données grâce à une réorganisation---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #126 - Comment l’ex-Head of Data de Lydia monte le département Data chez May

    35:20
    Christelle Marfaing, ex-Head of Data de Lydia, est aujourd’hui Chief Data Officer de May, la startup qui a développé une app d’avantages salariés (3 millions d’euros levés en 2022).Cet épisode est le 1er d’une nouvelle série dont l’objectif est d’inviter des Head of Data qui ont déjà monté ou structuré une équipe Data et qui recommencent dans une plus petite structure.Aujourd’hui, Christelle nous parle du lancement du département Data chez May après avoir dirigé une équipe de 14 personnes chez Lydia.On aborde :🔥 Son choix de rejoindre une jeune startup après son passage chez Lydia🔥 Le contexte data chez May, ses premières initiatives et ses choix techno (Airbyte, Dagster…)🔥 2 sujets qu’elle décide de lancer très tôt : Data Contracts et RGPD🔥 Sa vision sur la GenAI et comment elle est utilisée au sein du Produit chez May.---❤️ PARTENAIRECe podcast est rendu possible par Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/---🎬 CHAPITRES00:00 Générique01:46 Intro02:54 Pourquoi revenir en startup après Lydia ?04:41 Présentation de May07:13 Le contexte data à son arrivée07:55 Ses premières initiatives : POC, Data Contracts, RGPD14:39 La stack mise en place (Airbyte, Dagster…)17:29 Buy vs build25:00 Sa vision sur la Generative AI---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER 🇬🇧 #106 - Aircall: Adapting the Data Strategy to the slowing economic environment#77 - Sunday : Scaler grâce à une orga Data Mesh#50 - Ledger : Monter le département Data d'une licorne---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #125 - Reconversion | De Directeur de Magasin à Data Analyst

    16:04
    Vincent Gossiaux était Directeur de Magasin et s’est reconverti vers un rôle de Consultant Data Analyst chez Elevate, le cabinet de conseil spécialisé en data.On aborde :🔥 Son parcours et ce qui l’a poussé à se reconvertir dans la data,🔥 Pourquoi il a choisi DataBird et le déroulement de la formation,🔥 Les compétences qu’il utilise le plus au quotidien,🔥 Ses principaux chantiers actuels et ses conseils pour se reconvertir.---❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : bit.ly/47UthCv---🎬 CHAPITRES00:00 Générique01:02 Intro02:45 Le moment où Vincent décide de changer de carrière04:21 Focus sur la formation DataBird06:40 Son arrivée chez Elevate, cabinet de conseil en data08:48 Ses principaux chantiers au quotidien10:43 Ce que la formation lui a apporté11:43 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESLa newsletter Blef de Christophe BlefariLa chaîne Youtube de Luke Barousse---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#118 - Reconversion | Des Ressources Humaines à Data Analyst spécialisée RH#103 - Reconversion | De Responsable Études de Marché à Data Analyst#95 - Reconversion | De Journaliste à Data Analyst#71 - Lancer sa carrière data avec Kevin Rosamont Prombo---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #124 - ManoMano : L’ex-Chief Product Officer partage sa Stratégie Data

    34:27
    Pierre Fournier est l’ancien Chief Product Officer de ManoMano, la licorne qui propose un site e-commerce spécialisé dans le bricolage. Elle est présente sur 6 marchés (France, Belgique, Espagne, Italie, Allemagne, Royaume-Uni), compte aujourd’hui plus de 5 000 marchands et 19 millions de références.On aborde :🔥 Les prémices de la data chez ManoMano au Marketing et au Produit,🔥 Pourquoi il ne faut pas être trop data-driven lorsqu’on fait du Produit,🔥 L’importance de définir des métriques utilisateurs (versus business),🔥 Ses plus gros challenges data : tracking, culture et collaboration Data x Produit.---❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : bit.ly/47UthCv---🎬 CHAPITRES00:00 Générique01:12 Intro02:18 Pierre nous explique ses choix de carrière04:04 Son point de vue sur les GAFAM06:03 Leur ADN data07:59 Être ou ne pas être trop data driven, telle est la question13:17 L’importance des métriques utilisateurs versus business22:08 La collaboration entre les équipes Data et Produit25:34 Ses plus gros challenges data28:07 Ses conseils aux équipes Data pour mieux collaborer avec le Produit30:39 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESData Strategy de Bernard MarrStatistics Done Wrong de Alex ReinhartRelevant Search de Doug Turnbull & John Berryman---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#97 - Contentsquare : Lancer l’équipe Product Analytics#53 - Pennylane : Utiliser la data en tant que Product Manager#44 - IbanFirst : Mieux collaborer avec l'équipe Produit#36 - Dashlane : Monter une équipe Product Analytics---💪 VOUS AVEZ UN PROJET DATA ?DataGen, c'est aussi un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Head of Data, Data Analyst, Data Engineer, Data Scientist... On a l'équipe qu'il vous faut !👉 Nous rencontrer---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹---🔔 ABONNEZ-VOUS POUR SOUTENIR LE PODCAST GRATUITEMENT ! 🥰
  • #123 - Starburst : Accélérer l’accès au Data Lake et attaquer plusieurs sources en une requête

    23:22
    Jérôme Campo est Solution Architect chez Starburst, la licorne américaine valorisée 3 milliards de $ qui propose une solution qui permet de requêter les Data Lake et de les fédérer avec d'autres sources, avec des grosses performances et avec des coûts très compétitifs. Pas très connue du grand public, c'est pourtant la solution qui est déjà utilisée par quasiment la moitié du CAC 40.On aborde :🔥 Son parcours entre Microsoft, Google, Cloudera et Starburst🔥 La technologie Open Source sous-jacente fondée en 2012 chez Facebook (aka Presto)🔥 Les 2 usages de Starburst : accélérer l’accès au Data Lake et attaquer plusieurs sources en une seule requête🔥 Où se positionne l’outil dans la stack versus le Data Warehouse, Fivetran, dbt…---❤️ PARTENAIRESCe podcast est rendu possible par :Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/Starburst, la solution qui permet de requêter les Data Lake et de les fédérer avec d'autres sources.👉 Contactez Jérôme pour en savoir plusLeur site : https://engage.starburst.io/frSon mail : jerome.campo@starburstdata.comSon LinkedIn : https://www.linkedin.com/in/jérôme-campo-06344019/---🎬 CHAPITRES00:00 Générique01:41 Intro03:34 À quoi sert Starburst ?05:07 1er usage : accélérer l’accès au Data Lake (Hadoop)07:17 Illustration avec Crédit Mutuel Arkea09:59 2ème usage : attaquer plusieurs sources avec une seule requête (multi-source / multi-cloud)12:51 Le positionnement de Starburst dans la Stack Data (Warehouse, Fivetran, dbt)14:37 Paysage concurrentiel15:55 La fonctionnalité de Starburst compatible avec l’approche Data Mesh18:32 Les questions de la fin (ressources, conseils...)---📚 RESSOURCESLe LinkedIn de Zak WilsonLe User Group de Starburst---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#117 - Masterclass | Tout comprendre sur les IA Génératives#111 - DataGalaxy : Mettre en place un Data Catalog#91 - Spendesk : Adopter l'approche Analytics Engineering---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #122 - 360Learning : Déployer un projet GenAI avec GPT-4

    28:35
    Marie Douriez est Machine Learning Engineer chez 360Learning, la plateforme qui permet aux entreprises de créer des formations et de piloter leur suivi par leurs collaborateurs. Avant ça, elle est passée par Netflix et Lyft, 2 boîtes américaines connues pour être extrêmement data-driven. 360Learning compte près de 2000 clients en Europe et aux US. Ils sont 400 salariés dont 80 ingénieurs. Marie nous parle d’un projet GenAI qui permet à leurs utilisateurs de créer des cours en quelques minutes qui est aujourd’hui live dans le produit.On aborde :🔥 Son parcours et son passage à San Francisco : Berkeley, Lyft, Netflix🔥 Les grandes phases du projet GenAI et l’usage de GPT-4🔥 Les challenges principaux : expérience utilisateur, personnalisation, métriques de succès…🔥 L'évolution du métier de Machine Learning Engineer.---❤️ PARTENAIRECe podcast est rendu possible par Eulidia, le cabinet de conseil et d'expertise technique spécialisé sur la data et l'IA.👉 Contactez Benjamin pour vous faire accompagnerSon mail : bcohen@eulidia.comSon LinkedIn : https://www.linkedin.com/in/cohenlhyver/👉 Mettez Elisa également dans la boucleSon mail : echarbonnier@eulidia.comSon LinkedIn : https://www.linkedin.com/in/elisa-charbonnier-737219121/---🎬 CHAPITRES00:00 Générique01:31 Intro05:14 Le projet GenAI développé par 360Learning10:22 Comment ils utilisent GPT-412:38 Les dernières features développées17:22 L'évolution du métier de Machine Learning Engineer19:17 Les challenges principaux : XP utilisateur, personnalisation…22:57 Le bilan24:14 Les next steps : nouveaux produits GenAI notamment pour améliorer l'XP côté élève25:12 Les questions de la fin (ressources, conseils...)---📚 RESSOURCES- Data Driven 101, le podcast de Marc Sanselme- Les meetups Generative AI Paris---🧐 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#117 - Eulidia : Tout comprendre sur les IA Génératives#110 - Back Market : Leur stratégie Data Science#102 - Databricks : Une stack unique pour l’Analytics et l’IA---👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹---🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰