Partager

cover art for #7 - Yzr : Automatiser la préparation de données par l'IA

DataGen

#7 - Yzr : Automatiser la préparation de données par l'IA

Yosr Mhiri est Chief Product Officer chez Yzr, une technologie d’intelligence artificielle qui automatise la normalisation et la standardisation des données.


La startup a levé 2 millions d’euros au tout début de l'année 2021 pour accélérer sa croissance et compte déjà parmi ses clients des grandes entreprises tel que Monoprix.


Dans cet épisode, Yosr nous parle de son parcours et des chantiers qu’elle a menés pour développer le produit. On aborde également les challenges principaux que l’on rencontre lorsqu’on lance un produit IA.


---


🎙 SOUTENEZ LE PODCAST GRATUITEMENT


1/ Abonnez-vous 🔔

2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰


---


👋 PLUS DE CONTENU DATA ?


1/ Suivez-moi sur LinkedIn (tips/réflexions) ici 🤳

2/ Inscrivez-vous à la newsletter (synthèses, ressources, événements) ici 💌

3/ Découvrez les podcasts en format vidéo sur YouTube ici 📹

More episodes

View all episodes

  • #149 - Se reconvertir et devenir Lead Data en freelance avec Benjamin Dubreu (58K abonnés LinkedIn)

    36:26|
    Benjamin Dubreu est aujourd’hui Lead Data Engineer en freelance. Il s’est reconverti dans la data il y a 6 ans suite à une thèse en Sciences Politiques. Depuis, il a travaillé pour des grands groupes (BNP Paribas, TotalEnergies) et des scaleups. En parallèle, il crée du contenu data avec beaucoup de succès (58 000 abonnés sur LinkedIn) et a lancé une formation à la data pour progresser notamment sur des sujets techniques comme le Data Engineering.🎬 CHAPITRES00:00 Générique01:00 Intro01:50 Le parcours de Benjamin07:39 La comparaison du salaire en CDI versus en freelance11:50 Pourquoi passer de Data Scientist à Data Engineer ?16:02 La priorité : travailler ses fondamentaux19:30 L'impact des IA génératives sur les métiers data23:37 Comment s'insérer sur le marché en tant que freelance aujourd’hui ?29:11 La formation Data Upskilling de Benjamin31:55 Les questions de la fin (ressources, conseils...)💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer📚 RESSOURCES- Le Linkedin de :Benjamin DubreuDamien BenvenisteZach WilsonAndrew Ng- La formation Data Upskilling de Benjamin- La newsletter sur le freelancing de Benjamin- Le livre So Good They Can't Ignore You de Cal Newport- Le livre The Art of Learning de Josh Waitzkin🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#144 - Mettre en place une Data Gouvernance avec Charlotte Ledoux#121 - Lancer sa carrière en Data Science avec Natacha Njongwa Yepnga#71 - Lancer sa carrière data avec Kevin Rosamont Prombo👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #148 - Ledger : Leurs 6 projets GenAI en production

    29:46|
    Michael Benisti est Head of Data & AI chez Ledger, la licorne leader mondial de la sécurisation des cryptomonnaies. Après un épisode sur leur stack et leur orga (épisode #50), Michael revient présenter sa stratégie IA Génératives et 6 projets qu’ils ont déjà mis en production.On aborde :🔥 La genèse des projets GenAI chez Ledger🔥 Leurs projets GenAI “tactiques” : YouTube Analyser, Reddit Sentiment Analysis…🔥 Leurs projets GenAI “stratégiques” : Customer Chatbot, GitHub Copilot et du “Ledger Assistant”🔥 L’organisation pour délivrer et les plus gros challenges qu’ils rencontrent.❤️ PARTENAIRECe podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.👉 Lien vers leur site internet : https://bit.ly/47UthCv📚 RESSOURCESLa plateforme d’Andrew Ng DeepLearning.AIle comparateur de LLMs Chatbot Arena🎬 CHAPITRES00:00 Générique01:30 Intro03:08 La genèse des projets GenAI chez Ledger04:28 Le projet YouTube Analyser06:58 Le projet Reddit Sentiment Analysis09:22 Le projet Catalog Position Tracker11:19 Le chatbot à destination des clients15:01 Le déploiement de GitHub Copilot18:05 Le projet “Ledger Assistant”22:39 L’orga pour délivrer les projets23:30 Leurs plus gros challenges sur ces projets GenAI26:48 Les prochaines étapes de Ledger en GenAI27:24 Les questions de la fin (ressources GenAI)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER #146 - L’Oréal : Mettre en place une Stratégie IA Génératives#138 - Ovrsea : Adopter les GenAI et Gagner 50% de Productivité#50 - Ledger : Monter le département Data d'une licorne👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #147 - Comment faire de la France un leader de l’IA ? Les 6 recommandations remises au gouvernement par la Commission IA

    32:37|
    Arno Amabile est le Rapporteur Général de la Commission IA instaurée par l’ex-Première ministre et constitué de pontes du secteur tels que Yann LeCun, Arthur Mensch, Dr. Luc Julia, Anne Bouverot…. Ils ont formulé des recommandations pour orienter la stratégie IA du gouvernement et faire de la France un leader de l’IA.On aborde :🔥 La genèse de la Commission IA et du Plan IA🔥 La revue des 6 recommandations clés (sensibilisation, investissement, puissance de calcul…)🔥 Les débats qui ont animé les membres de la commission (ex : AI Act)🔥 L’adoption du plan IA au sein du gouvernement.💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer : https://www.datageneration.co/📚 RESSOURCES- Le LinkedIn de Arno : https://www.linkedin.com/in/amabile-arno/?originalSubdomain=fr- La newsletter de Benedict Evans : https://www.ben-evans.com/newsletter- Le podcast américain The Ezra Klein Show : https://podcasts.apple.com/us/podcast/the-ezra-klein-show/id1548604447🎬 CHAPITRES00:00 Générique00:58 Intro03:35 Reco #1 : un plan de sensibilisation et de formation de la nation06:31 Reco #2 : réorienter l’épargne vers l’innovation, fonds “France & IA” de 10 Mds10:38 Reco #3 : faire de la France un pôle majeur de la puissance de calcul18:58 Reco #4 : faciliter l’accès aux données22:20 Reco #5 : assumer le principe d’une “exception IA” dans le secteur publique24:03 Reco #6 : promouvoir une gouvernance de l’IA25:31 Comment le consensus s’est-il fait au sein de la commission ?28:58 Aujourd’hui, comment ce plan est adopté par le gouvernement ?30:48 Les questions de la fin (ressources, conseils...)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER‎#140 - Chief Data & AI Officer au Service du Premier Ministre‎#117 - Masterclass | Tout comprendre sur les IA Génératives‎‎#46 : Gouvernement : Monter la cellule data de l'Élysée👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #146 - L’Oréal : Mettre en place une Stratégie IA Génératives

    38:28|
    Jean-Paul Paoli est Generative AI Business Transformation Director chez L’Oréal, le leader mondial du secteur de la beauté qui emploie 86 000 personnes dans 150 pays au travers de 36 marques internationales. Jean-Paul est venu aujourd’hui nous offrir une masterclass sur la stratégie GenAI qu’il met en place.🎬 CHAPITRES00:00 Générique01:24 Intro01:43 Le contexte Data & IA chez L’Oréal04:04 Le parcours de Jean-Paul06:08 Les prémices de la stratégie GenAI chez L'Oréal08:48 La mise en place de cette stratégie13:17 Use case #1 : la production de contenu marketing18:10 Use case #2 : Beauty Genius, le conseiller de beauté virtuelle21:42 Focus sur la partie Tech30:01 Les principales difficultés de Jean-Paul33:06 Les questions de la fin (ressources, conseils...)❤️ PARTENAIRECe podcast est rendu possible par Qlik, le nouveau géant de la data qui couvre toute la chaîne de l’ingestion à la visualisation.👉 Découvrir l'épisode avec Charles👉 Contacter Charles sur LinkedIn ou par mail : charles.clement@qlik.com📚 RESSOURCES- Suivre Benoit Raphael- Suivre Olivier Martinez- Suivre Gilles Guerraz- La newsletter One Useful Thing d’Ethan Mollick- Le podcast The Cognitive Revolution🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#138 - Ovrsea : Adopter les GenAI et Gagner 50% de Productivité#127 - Doctolib : Déployer une stratégie IA Générative#117 - Masterclass | Tout comprendre sur les IA Génératives💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #145 - On décrypte avec Blef : Les sommets Snowflake, Databricks et la techno Iceberg

    29:12|
    Christophe Blefari est Staff Data Engineer, auteur de la newsletter data la plus connue au sein de l’écosystème français (Blef.fr). Il est également selon moi l’un des plus gros experts data en France. Aujourd’hui, on décrypte l’actu data ensemble.On aborde :🔥 Les annonces clés des sommets Snowflake & Databricks (Iceberg, Polaris, Spark 4.0, Tabular…)🔥 Qu’est-ce que la technologie Iceberg et pourquoi tout le monde en parle ?🔥 Le positionnement de BigQuery en comparaison avec Snowflake et Databricks🔥 1 news : un mini LLM qui tourne dans un navigateur web.💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer : https://www.datageneration.co/📚 RESSOURCES- Le LinkedIn de Christophe- La newsletter de Blef- La conférence Forward Data avec Blef- L'article sur les hallucinations- Le post de Thomas Wolf sur le mini LLM qui tourne dans un navigateur web🎬 CHAPITRES00:00 Générique00:29 Intro01:39 Les sommets Snowflake & Databricks08:14 Les annonces clés de Snowflake10:27 L’impact pour des équipes data 13:15 Les annonces clés de Databricks16:23 Zoom sur la techno Iceberg21:14 Le positionnement de BigQuery vs Snowflake et Databricks23:32 La news : un mini LLM qui tourne dans un navigateur web🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#141 - On décrypte avec Blef : GenAI & Self-Service, Metric Tree, ClickHouse#139 - Google Cloud : Les 3 tendances data & IA de 2024#120 - La fin de la Modern Data Stack ? Avec Blef👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #144 - Mettre en place une Data Gouvernance avec Charlotte Ledoux (20K abonnés LinkedIn)

    36:17|
    Charlotte Ledoux est une experte Data Gouvernance et également une créatrice de contenu sur LinkedIn à succès (+20K abonnés). Elle est venue nous faire une masterclass sur son sujet de prédilection : la Data Gouvernance.On aborde :🔥 Qu’est-ce que la Data Gouvernance ?🔥 La méthodologie de Charlotte en 3 étapes : état des lieux, “buy in”, 1ères batailles…🔥 Les grosses difficultés liées à la Data Gouvernance🔥 L’impact des GenAI sur les projets de Data Gouvernance.💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Rencontrez-nous ici.📚 RESSOURCESSon LinkedInSon ebookSa newsletterLe compte LinkedIn de Modern Data 101La chaîne YouTube The Data Governance Coach🎬 CHAPITRES00:00 Générique01:21 Intro06:05 Qu’est-ce que la Data Gouvernance ?07:41 La méthodologie de Charlotte : étape 1/ L’état des lieux10:10 Etape 2/ Obtenir le buy-in13:31 Etape 3/ Lancement opérationnel25:24 Les grosses difficultés liées à la Data Gouvernance28:12 L’impact des GenAI sur la Data Gouvernance32:12 Les questions de la fin (ressources, conseils...)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER 🇬🇧 #114 - BlaBlaCar : Managing 50 Data People with Manu, VP Data#111 - DataGalaxy : Mettre en place un Data Catalog#101 - Kering : Lancer un programme de Data Gouvernance avec une approche Data Mesh#94 - CybelAngel : Implémenter une stratégie de Data Gouvernance en 5 piliers👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #143 - Masterclass | Tout comprendre sur le DataOps avec Matthieu Rousseau

    23:43|
    Matthieu Rousseau, expert en Data Engineering et DataOps, a fondé Modeo, un cabinet de conseil spécialisé sur la Modern Data Stack et le DataOps qui travaille avec des Grands Groupes et des Startups.On aborde :🔥 La définition du DataOps et la différence avec le Data Engineering🔥 À quel type de boîte peut bénéficier une équipe DataOps🔥 Comment mettre en place une approche DataOps en 5 piliers🔥 Les avantages et les difficultés lorsqu’on met en place une approche DataOps.❤️ PARTENAIRECe podcast est rendu possible par Modeo, le cabinet de conseil spécialisé sur la Modern Data Stack et le DataOps qui travaille avec des Grands Groupes et des Startups.👉 Contacter Matthieu sur LinkedIn ou par mail à matthieu@modeo.ai📚 RESSOURCES- Les articles de Modeo et notamment Construire son équipe et sa stratégie DataOps en 2024- Le blog de DataKitchen🎬 CHAPITRES00:00 Générique00:48 Intro01:39 Qu’est-ce que le DataOps ?02:28 Quelle est la différence entre le DataOps et le Data Engineering ?03:40 Quels types de boîtes peuvent mettre en place une équipe DataOps ?06:29 Comment mettre en place une approche DataOps ?09:39 La redéfinition du rôle de Data Engineer14:32 La timeline pour mettre en place une approche DataOps16:53 Les avantages de cette approche18:11 Les principaux challenges20:24 Les tendances observées par Matthieu22:12 Les questions de la fin (ressources, conseils...)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#142 - Brevo : Structurer l’équipe Data d’un centaure#92 - Saagie : Mettre en place une approche DataOps#85 - Masterclass | Comprendre la Modern Data Stack avec Matthieu Rousseau👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #142 - Brevo : Structurer l’équipe Data d’un centaure

    32:53|
    Bilal Baltagi est Data Director chez Brevo (ex-Sendinblue), la plateforme de marketing automation qui permet notamment d’orchestrer ses campagnes d'emailing ou de SMS. La scaleup a acquis le statut de “centaure” après avoir dépassé les 100 millions d’euros de revenus annuels.On aborde :🔥 Le parcours de Bilal et le contexte à son arrivée chez Brevo,🔥 L’organisation de l'équipe, la stack et les projets de Data Science,🔥 La création récente d’une équipe DataOps,🔥 Ses plus gros challenges et les prochaines étapes (ex : semantic layer)PARTENAIRE ❤️Ce podcast est rendu possible par DataBird, le bootcamp spécialisé sur la Data.📚 RESSOURCES- La newsletter Blef- Medium🎬 CHAPITRES00:00 Générique01:23 Intro05:29 Le contexte en arrivant chez Brevo07:12 L’approche de Bilal pour structurer ses chantiers10:02 La stack chez Brevo12:55 Exemple de projet Data Science15:04 Ses plus gros challenges18:13 L’orga de l'équipe Data21:15 Le DataOps chez Brevo24:50 Les prochaines étapes pour l'équipe Data27:43 Les questions de la fin (ressources, conseils...)🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#126 - Comment l’ex-Head of Data de Lydia monte le département Data chez May#110 - Back Market : Leur stratégie Data Science#92 - Saagie : Mettre en place une approche DataOps💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰
  • #141 - On décrypte avec Blef : GenAI & Self-Service, Metric Tree, ClickHouse

    31:47|
    Christophe Blefari est Staff Data Engineer, auteur de la newsletter data la plus connue au sein de l’écosystème français (Blef.fr) et membre du Collectif DataGen. Il est également selon moi l’un des plus gros experts data en France. Aujourd’hui, on décrypte l’actu data ensemble.On aborde :🔥 L’impact de la GenAI sur le Self-Service🔥 Le Concept de Metric Tree🔥 Comment progresser en tant que Data Engineer🔥 Le Real-Time Data Warehouse ClickHouse.💪 VOUS AVEZ UN PROJET DATA ?DataGen a lancé un collectif de freelances data issus des plus belles boîtes (BlaBlaCar, Aircall, Critéo, Artefact, 55, Sunday...).Vous avez un projet data ? On a l'équipe qu'il vous faut : Head of Data, Data Analyst, Data Engineer, Data Scientist, etc.👉 Nous rencontrer📚 RESSOURCESLa conférence d’Abhi Sivasailam Le Data Council 2024La Newsletter Everything is still BI de Benn Stancil🎬 CHAPITRES00:00 Générique01:07 Intro02:04 Text to insights : l’extension du self-service grâce à l’IA03:38 Dans les faits, est-ce que les boîtes l’utilisent ?06:07 Le concept du Metric Tree12:08 Comment se challenger au quotidien en tant que Data Engineer ?20:24 Son point de vue sur ClickHouse27:58 Les news de Blef : le talk Abhi Sivasailam & l’article “Everything is still BI” de Ben Stancil🤩 AUTRES ÉPISODES QUE VOUS DEVRIEZ AIMER#133 - Devenir Data Engineer aux US ou au Canada et gagner 250K$/an avec Willis Nana#128 - Le temps réel, grande tendance de 2024 avec Benjamin Djidi, CEO @Popsink#100 - On décrypte 3 tendances data de 2024 avec Christophe Blefari (aka Blef.fr) 🎁👋 PLUS DE CONTENU DATA ?1/ Suivez-moi sur LinkedIn ici 🤳2/ Inscrivez-vous à la newsletter (synthèses, événements) ici 💌3/ Découvrez le podcast en format vidéo sur YouTube ici 📹🎙 SOUTENEZ LE PODCAST GRATUITEMENT1/ Abonnez-vous 🔔2/ Laissez 5 étoiles et un avis sur Apple Podcasts ici 🥰