Partager

TsunamIA: surfez sur la vague du changement apporté par l'intelligence artificielle
#32 - Google Astra Vs GPT4o / Interview de Thomas, Ingénieur en Computer Vision
OpenAI a dévoilé GPT-4O, la nouvelle version de Chat GPT avec des capacités multimodales impressionnantes, tandis que Google a annoncé Gemini 1.5 pro, son propre modèle puissant désormais disponible en Europe.
Notre invité, Thomas, expert en vision par ordinateur, nous partage ses expériences et ses réflexions sur l'évolution rapide du domaine, les dangers potentiels de l'IA et les opportunités qu'elle représente. De la reconstruction 3D à la détection de faux visuels, nous décryptons les enjeux d'une technologie qui ne cesse de se transformer.
https://aitestkitchen.withgoogle.com/ génération d'images et de musique.
https://aistudio.google.com/ accès à Gemini 1.5 Pro.
https://openai.com/index/hello-gpt-4o/ les capacités multimodales de GPT-4O.
- 01:34 - GPT-4O d'OpenAI : un modèle multi-modal puissant et rapide.
- 05:32 - Impact de GPT-4O, Google Gemini 1.5 pro en Europe, éthique de l'IA.
- 06:55 - Gemini accessible sans VPN, Project Astra, modèle vidéo
- 09:58 - "Gems" de Google.
- 12:59 - Claude 3 : disponibilité en Europe.
- 14:08 - Présentation d'AI Test Kitchen.
- 15:36 - Interview de Thomas : vision par ordinateur, réseaux de neurones, évolution de l'IA.
- 18:33 - Apprentissage automatique, métadonnées, data poisoning.
- 20:56 - Réseaux de neurones, complexité et défis, biais, qualité des données.
- 24:08 - Le travail de Thomas sur la reconstruction 3D.
- 28:00 - Création d'un algorithme de vision par ordinateur, défis liés à la précision et aux faux positifs.
- 34:00 - Défis liés aux métadonnées, deepfakes, la responsabilité civile et la conduite autonome.
- 42:00 - Conduite autonome, IA open-source, "fine tuning" des modèles, l'aspect "boîte noire".
- 54:00 - Outils de vérification de l'authenticité, deepfakes et politique, le projet C2PA.
- 58:00 - L'impact de GPT-4O, capacités multimodales, dangers potentiels.
- 62:00 - Accès aux données, monopoles, IA ouverte.
- 66:00 - Enjeux économiques de l'IA, adoption par les entreprises.
- 70:00 - L'avenir de l'IA, les dangers potentiels.
- 74:00 - L'IA dans le marketing, les deepfakes, la vision de l'IA, risques liés à sa démocratisation.
More episodes
View all episodes

113. #113 - Alerte Rouge OpenAI : GPT-5.2, Gemini 3 et le Deal Disney
15:10||Ep. 113Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Bienvenue dans ce nouvel épisode flash de Tsunamia, le podcast dédié à la déferlante de l'intelligence artificielle.Cette semaine, votre hôte décrypte une actualité explosive marquée par le "Code Red" chez OpenAI. Face aux performances impressionnantes de Gemini 3 de Google, Sam Altman a riposté avec le lancement surprise de GPT-5.2. Au programme : des benchmarks saturés (ARC-AGI), une fenêtre de contexte élargie, mais toujours quelques hallucinations persistantes.L'industrie est en ébullition avec l'entrée fracassante de Disney qui investit 1 milliard chez OpenAI, ouvrant la voie à l'utilisation des licences cultes dans Sora. Côté open source, Mistral frappe fort avec DevStral 2, tandis que les géants de la tech s'unissent sous la bannière de la nouvelle AI Foundation pour standardiser les agents IA.Un épisode dense qui revient aussi sur les avancées de la génération vidéo avec Runway Gen-4.5 et les défis de l'authentification des contenus à l'approche de 2026.📢 N'hésitez pas à laisser un avis et un commentaire pour soutenir le podcast !⏱️ Au sommaire de cet épisode :00:00 - Introduction : Un format flash pour une semaine historique.00:51 - OpenAI vs Google : Sam Altman déclenche l'alerte rouge face à Gemini 3.01:17 - GPT-5.2 : Lancement de la nouvelle version et saturation du benchmark ARC-AGI.02:20 - Test & Thinking : Analyse des capacités de réflexion (8-10 min) et limites du modèle.04:18 - Spécifications : 400k tokens de contexte pour GPT-5.2 contre 1 million pour Gemini.06:04 - Génération d'images : Rumeurs sur les modèles "Chestnuts" et "Hazelnuts" d'OpenAI.06:50 - Google & NotebookLM : Le nouveau concurrent graphique intégré pour les présentations.07:26 - Le Deal Disney : 1 milliard investi et les droits d'auteur débloqués pour Sora.09:21 - Vidéo IA : Sortie de Runway Gen-4.5 et le flou grandissant entre réel et virtuel.11:25 - Authentification : Le protocole C2PA et les défis de la signature électronique.12:08 - Coding & Open Source : Mistral lance DevStral 2 et son interface Mistral Vibe.13:01 - Industrie : Création de l'Atlantic AI Foundation (OpenAI, Google, Microsoft, Amazon...).13:50 - Événement : Retour d'expérience sur les conférences APIdays et GenAI au CNIT.
112. #112 - Quand l'IA fait 80% de ton job : Utopie ou Dystopie ?
12:43||Ep. 112Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Imaginez un monde sans réveil le matin, sans réunions interminables, un monde où les robots et l'IA effectuent 80% du travail. Est-ce le paradis ou l'enfer sur Terre ?Cette semaine dans Tsunamia, on plonge dans le concept vertigineux de la "Société Post-Travail". Avec les progrès exponentiels de l'IA générative (Deep Research, codage expert, vidéo réaliste), ce futur n'est plus de la science-fiction, mais une possibilité concrète pour les décennies à venir.J'analyse pour vous deux scénarios radicaux :L'Utopie du RBU : Un monde financé par la "taxe robot" où la valeur sociale remplace la valeur marchande.La Dystopie Néo-Féodale : Une concentration extrême des richesses et une surveillance de masse où l'humain devient "superflu".Nous sommes à la croisée des chemins. Comment redéfinir notre utilité quand le travail salarié disparaît ? Comment éviter que l'IA ne creuse les inégalités ? On décrypte les enjeux philosophiques et économiques de cette révolution.Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Au sommaire de cet épisode :00:00 - Intro : Et si vous n'aviez plus besoin de travailler ? 😴00:48 - L'accélération brutale de l'IA (Les progrès récents) 📈01:45 - Scénario 1 : L'Utopie et la Taxe Robot 🌈02:30 - Redéfinir la "Valeur Sociale" (Le RBU) 🤝03:45 - Scénario 2 : La Dystopie et le Néo-Féodalisme technologique 💀05:10 - Le risque du chômage de masse structurel 📉06:20 - Le défi culturel : L'être vs L'avoir 🧠07:15 - Conclusion : Quel futur allons-nous choisir ? 🗳️Liens et ressources :Newsletter TsunamIA : https://tsunamia.substack.com/
111. #111 - Gemini 3 : La claque qui fait trembler OpenAI (+ Opus 4.5)
10:05||Ep. 111Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Cette semaine dans Tsunamia, épisode express mais intense ! On décrypte le séisme provoqué par la sortie de Gemini 3, qui semble avoir mis un véritable coup de pied dans la fourmilière. Est-il en passe de remplacer définitivement ChatGPT ?Je vous partage mon retour d'expérience après deux semaines d'utilisation : pourquoi Gemini 3 est devenu mon assistant par défaut et comment il surpasse la concurrence sur l'analyse et la présentation. On fait aussi le point sur la réponse d'Anthropic avec la sortie d'Opus 4.5 (le nouveau roi du code ?) et sa fonctionnalité controversée de compression de contexte.Au programme également : les capacités visuelles bluffantes de Nano Banana Pro intégré à NotebookLM pour vos slides, et l'arrivée de la V2 de Flux pour la génération d'images.Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Au sommaire de cet épisode :00:00 - Introduction & Projets pour la rentrée de Janvier (Appel à témoins) 👋01:25 - Gemini 3 : Le modèle qui fait trembler OpenAI (et Sam Altman) 🚀02:15 - Comparatif : Pourquoi Gemini 3 remplace mon "Daily" ChatGPT 🤖03:10 - Anthropic : Sortie d'Opus 4.5 et la nouvelle compression de mémoire (Top ou Flop ?) 🧠05:25 - Nano Banana Pro : Création de présentations et design via NotebookLM 📊06:15 - Flux V2 : La nouvelle référence Open Source pour l'image 🎨06:45 - Conclusion & Actus à suivre 🗞️Liens mentionnés dans l'épisode :La chaîne YouTube (pour voir la démo Gemini 3) : https://www.youtube.com/watch?v=AjmxmQOTDOsNewsletter TsunamIA : https://tsunamia.substack.com/
110. #110 - Gemini 3, Anti-Gravity & Robots autonomes : La réponse XXL de Google 🌊🤖
33:25||Ep. 110Cette semaine dans TsunamIA, on plonge au cœur du réacteur avec la sortie majeure de Gemini 3. Est-ce le modèle qui va détrôner OpenAI ?Je décrypte pour vous les capacités multimodales bluffantes de ce nouveau modèle à travers des démos concrètes (génération d'applications, analyse de manuscrits, cartes interactives). On fait également le tour des nouveautés chez DeepMind avec Sima 2, la mise à jour de GPT-5.1, et le nouvel IDE de Google, Anti-Gravity, qui vient chasser sur les terres de Cursor et WindSurf.Au programme également : des robots autonomes qui font le ménage, l'analyse d'une cyberattaque par Anthropic, et les dernières actus business de l'IA.Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Au sommaire de cet épisode :00:00 - Introduction & Menu de l'épisode 👋00:27 - Sima 2 (Google DeepMind) : L'IA apprend à naviguer dans les jeux vidéo et la 3D 🎮02:27 - Unitree : Le robot autonome qui fait (vraiment) le ménage 🧹03:53 - GPT-5.1 : Une mise à jour mineure mais qui respecte enfin les consignes 🤖04:40 - Anthropic : Nouveaux cas d'usage professionnels pour Claude 4 💼05:27 - NotebookLM : Analyse d'images, OCR et "Deep Research" intégrée 📚08:39 - Gemini 3 : Le gros morceau ! Accès, VPN et création d'artefacts complexes 🚀11:08 - Démos Gemini 3 : Analyse musicale de Mozart & Création d'un site touristique interactif 🎵🗺️13:17 - Prompt Engineering : Création d'un optimisateur de prompts via Google AI Studio 🛠️16:02 - Cybersécurité : Visualisation de l'attaque analysée par Anthropic (Claude) 🛡️21:44 - Anti-Gravity : Le nouvel IDE de Google pour concurrencer Cursor et WindSurf 💻24:10 - Actus en vrac : Amazon Prime (résumés IA), AlphaProof (Maths), Lovable (Revenus), et l'impact des Chatbots sur les divorces 🗞️31:33 - Régulation : Vers un assouplissement de l'AI Act et des cookies en Europe ? 🇪🇺Liens mentionnés dans l'épisode :Notebook sur le Prompt Engineering (Vidéo générée) :https://notebooklm.google.com/notebook/af3cef64-f155-4d3c-97e4-ce04a108c278 Application "Optimisateur de Prompts" (Gemini 3) :https://ai.studio/apps/drive/1ZzFXfwsBnWoIRkINBfrhpOn4j-uYUIooVisualisation de l'attaque Anthropic (Site généré) :https://ai.studio/apps/drive/1m4Ey6CC454YCRpNZsSk5G0qrrcoF6S18?fullscreenApplet=true
109. #109 - Foobot : L'IA qui réduit la facture énergétique des bâtiments (Rediffusion)
01:02:54||Ep. 109⚡️ Abonnez-vous à la newsletter de Tsunamia pour ne rien manquer : http://tsunamia.substack.com/🎙️ Foobot : L'IA qui réduit la facture énergétique des bâtiments (Rediffusion)Cette semaine, Tsunamia vous propose une rediffusion d'un épisode passionnant ! (Pas d'inquiétude, l'actualité brûlante sur GPT-5.1 et Gemini 3 sera couverte très bientôt).Plongez dans l'univers de Foobot avec son cofondateur, Inouk Bourgon. Découvrez comment leur solution logicielle, basée sur l'IA, optimise la consommation énergétique (chauffage, ventilation, climatisation) des bâtiments tertiaires.Inouk explique comment Foobot utilise le Deep Reinforcement Learning (DRL) – une technologie inspirée par DeepMind (AlphaGo, optimisation des data centers Google) – pour agir comme un ingénieur virtuel, trouvant les meilleurs réglages pour économiser entre 11% et 45% d'énergie sans sacrifier le confort. Un cas d'usage concret de l'IA, loin du "buzz" de l'IA générative.⏱️ Au sommaire de cet épisode :00:00 - Introduction et retard (Rediffusion)01:21 - Rencontre avec Inouk Bourgon, cofondateur de Foobot02:05 - Le service Foobot : optimiser l'énergie des bâtiments tertiaires02:45 - Une solution 100% logicielle (add-on)05:09 - L'origine de Foobot : de la qualité de l'air aux économies d'énergie09:08 - Les économies réalisées : entre 11% et 45%11:32 - L'inspiration technique : le papier de DeepMind (Google)12:12 - Qu'est-ce que le Deep Reinforcement Learning (DRL) ? (AlphaGo)16:15 - Le défi : créer un environnement de simulation23:01 - Le défi de l'adoption : IA générative vs. process industriels31:33 - Le "problème" de la boîte noire de l'IA pour les ingénieurs34:46 - Bilan carbone : l'IA de Foobot économise plus qu'elle ne consomme44:35 - L'IA "buzz" (ChatGPT) a-t-elle aidé Foobot ? (La réponse est non)50:38 - L'impact de l'AI Act (réglementation européenne)54:28 - Le futur de l'IA : entre hype, déception et AGI01:01:05 - Le mot de la fin : le statut JEI (Jeune Entreprise Innovante)
108. #108 - Tests d’outils IA, robots chinois et scandale LinkedIn : le grand débrief de la semaine
36:28||Ep. 108Pour ne rien rater, abonnez-vous à la Newsletter : http://tsunamia.substack.com/Plongez ensuite dans une série de tests d'outils :Génération de slides : On compare Skywork (une IA chinoise) et l'intégration de Gemini dans Canva pour créer des présentations.Modèles Open Source : Découvrez MiniMax M2, un nouveau modèle chinois qui rivalise avec les géants payants comme GPT-5 et Claude. On le teste en direct pour créer un site web.Agents IA : Tentative (et échec) de création de workflows automatisés avec Pokee.ai, une plateforme prometteuse mais encore en bêta.Génération Vidéo : Test de Odyssey pour sa génération vidéo en temps réel et de Hailuo AI (par Minimax) pour ses résultats qualitatifs.⏱️ Au sommaire de cet épisode :(00:27) - 🎄 Coca-Cola & IA : Analyse de la nouvelle publicité de Noël 100% IA et son évolution.(03:28) - slides Skywork : Test de l'outil IA chinois pour générer des présentations.(06:49) - 🎨 Gemini + Canva : Créer des slides directement dans l'écosystème Google.(09:33) - 🏆 MiniMax M2 : Le nouveau modèle open source chinois qui performe sur les benchmarks.(12:19) - 💻 Test MiniMax : Création d'un site web en direct (avec une photo ratée !).(15:00) - 🤖 Pokee.ai : Le futur des agents IA ? Test (non concluant) de l'outil de workflow.(19:38) - ⚡ Odyssey : L'IA de génération vidéo ultra-rapide et en temps réel.(21:48) - 🎬 Hailuo AI : Le générateur vidéo qualitatif (et open source) de Minimax.(24:04) - 🔒 LinkedIn : ATTENTION, le réseau utilise vos données pour son IA (comment le désactiver).(26:48) - 🇫🇷 ComparIA vs LM Arena : Le classement français des IA (Mistral 1er) face aux benchmarks mondiaux.(33:12) - 🎨 Google Pomelli : L'outil de Google Labs crée votre identité de marque depuis votre site.(34:47) - 🚶♂️ XPeng Robots : Présentation des nouveaux robots humanoïdes chinois au design fluide.🔗 Liens mentionnésMiniMax (Modèle M2) : https://agent.minimax.io/Pokee.ai (Workflows) : https://pokee.ai/Skywork (Slides) : https://skywork.ai/Hailuo AI (Vidéo) : https://hailuoai.video/Désactiver partage données LinkedIn : https://www.linkedin.com/mypreferences/d/settings/data-for-ai-improvementComparIA (Gouvernement FR) : https://comparia.beta.gouv.fr/rankingLM Arena (Leaderboard mondial) : https://lmarena.ai/leaderboardGoogle Pomelli (Branding) : https://labs.google.com/pomelli/about/
107. #107 - Google AI Studio code en live, Claude arrive sur Excel, et les biais de Grokipedia
26:03||Ep. 107Abonnez-vous à la Newsletter : https://tsunamia.substack.com/Au programme : la nouvelle interface Google AI Studio et sa fonction de live coding impressionnante pour créer des apps (comme un simulateur de devis) en direct. 🧑💻 Google teste aussi Pomelli, un outil (encore instable) pour générer une image de marque depuis une URL. On explore Flowith, un concurrent d'Atlas (OpenAI) pour automatiser des tâches, avec des résultats mitigés. 🤖Côté news : OpenAI clarifie sa structure (Fondation vs For-Profit), NotebookLM se dote d'un thème "manga" 🎨, et Anthropic tease l'arrivée de Claude dans Excel (le "vrai" Copilot ?). 📈Enfin, analyse critique de Grokipedia d'Elon Musk, qui semble "oublier" certains sujets (Hyperloop) 🧐, et la sortie de DeepSeek OCR, un modèle OCR open-source ultra-rapide (mais attention à la data !).⏱️ Timestamps00:53 - Google AI Studio : Nouvelle interface et "Live Code Gen AI" 💻02:18 - Google AI Studio : Démo de création d'un simulateur de devis04:43 - Google Labs : Pomelli, l'outil de branding (en test) 🎨06:27 - Google AI Studio : Update de la démo (TVA) et comparaison (Gemini, Claude)07:27 - Flowith : Un nouvel agent IA (concurrent d'Atlas/OpenAI) 🤖09:20 - OpenAI : Clarification de la structure (Fondation vs For-Profit) 🏛️11:12 - NotebookLM : Nouvelle fonctionnalité vidéo (thème Manga) 🇯🇵12:34 - Anthropic : Claude arrive sur Excel (le vrai Copilot ?) 📈14:01 - Flowis : Résultats du test (échecs et hallucinations) 😅14:55 - xAI / Grok : Lancement de Grokipedia15:45 - Grokipedia : Analyse critique des biais (vs Wikipédia) 🧐19:21 - DeepSeek : Lancement du nouveau modèle OCR open-source ⚡20:17 - DeepSeek : Attention aux données et RGPD (serveurs en Chine) 🇨🇳🔗 Liens mentionnésNewsletter TsunamiA : https://tsunamia.substack.com/L'IA Café (Podcast) : https://podcasts.apple.com/fr/podcast/i-a-caf%C3%A9-enqu%C3%AAte-au-c%C5%93ur-de-la-recherche/id1536649984
106. #106 - Atlas : le navigateur d’OpenAI qui veut remplacer Chrome
14:42||Ep. 106Dimitri décrypte cette semaine la sortie surprise d’Atlas, le nouveau navigateur d’OpenAI. Une avancée majeure qui pourrait redéfinir notre manière de naviguer et d’interagir avec ChatGPT 🌐🧠 Pourquoi c’est important :OpenAI veut capter la donnée utilisateur en intégrant ChatGPT directement dans un navigateur. Comme Chrome, Brave ou Perplexity (avec son projet Comet), Atlas repose sur Chromium, mais y ajoute le fameux mode Agent, capable de naviguer, cliquer et exécuter des tâches autonomes.📬 Abonnez-vous à la newsletter TsunamIA :👉 http://tsunamia.substack.com/🕒 Timestamps condensés00:00 – Intro et format de l’épisode 🎙️00:38 – OpenAI Atlas : le navigateur qui change tout 🌐01:20 – Tous les navigateurs IA reposent sur Chromium 🧩02:03 – La stratégie de captation des données 🧠02:53 – Activer ou non la mémoire : le dilemme vie privée 🔐03:21 – L’écosystème fermé d’OpenAI 💡03:53 – Atlas disponible sur macOS (Windows et mobile à venir) 🍏04:04 – Démo du mode Agent / Operator 🤖05:00 – Recherche d’un vélo sur Leboncoin 🚴♂️07:21 – Création d’un logo sur Canva 🎨08:26 – Les limites du mode opérateur ⚙️10:36 – Test : récupération automatique de fichiers PLU 🏗️11:32 – Interface, historique et navigation d’Atlas 🔍13:07 – Claude Code (Anthropic) : l’environnement en ligne 💻13:28 – Veo 3.1 (Google) : le modèle de génération vidéo 🎥13:54 – Collaboration avec IA Café (Jean-François Sénéchal) 🎧14:32 – Conclusion & teaser du prochain épisode 🌊🔗 Liens mentionnésNewsletter TsunamIA → http://tsunamia.substack.com/Podcast IA Café → https://podcasts.apple.com/fr/podcast/i-a-caf%C3%A9-enqu%C3%AAte-au-c%C5%93ur-de-la-recherche/id1536649984
105. #105 - Les 12 Commandements de l'IA : Le Guide Pour Surfer sur la Vague 🌊
32:16||Ep. 105Pour ne rien rater, abonnez-vous à la newsletter : https://tsunamia.substack.com/Les 12 Commandements de l'IA : Le Guide Ultime pour Ne Pas Finir Comme KodakDans cet épisode spécial de TsunamIA, votre animateur met de côté l'actualité pour revenir aux fondamentaux ! ⚡️ Découvrez une présentation complète et accessible pour comprendre les véritables enjeux de l'intelligence artificielle.L'épisode s'ouvre sur une analogie saisissante : l'histoire de Kodak, géant de la photographie qui a raté le virage du numérique. Une leçon pour toutes les entreprises qui ignorent encore le tsunami de l'IA. 📸➡️📱À travers "Les 12 Commandements de l'IA", cet épisode décrypte tout ce que vous devez savoir :Pourquoi l'IA est bien plus vaste que ChatGPT (avec des exemples comme AlphaFold et AlphaDev).Le rôle essentiel des données : sans elles, pas d'IA.Les hallucinations 😵, les biais cachés et la "ligne éditoriale" de chaque modèle.Le fonctionnement interne de ChatGPT, qui n'est pas qu'un simple modèle de langage mais un assistant doté d'outils.L'arrivée des agents IA, la prochaine révolution pour automatiser nos tâches.Un guide indispensable pour naviguer la vague de l'IA, que vous soyez débutant ou expert.Abonnez-vous à la Newsletter pour des analyses exclusives : https://tsunamia.substack.com/AU PROGRAMME : 00:00:00 - Intro : Un format spécial pour maîtriser les bases de l'IA.00:01:38 - L'histoire de Kodak : La parabole de l'innovation à ne pas ignorer. 📉00:06:25 - Commandement n°1 : L'IA, bien plus que ChatGPT (AlphaFold, AlphaDev). 🧠00:10:00 - Commandements n°2 & 3 : Le rôle crucial des données et la "ligne éditoriale" des IA. ✍️00:13:07 - Commandement n°4 : Les hallucinations et les risques de l'IA. ⚖️00:16:33 - Commandement n°5 : Comment fonctionne vraiment ChatGPT (LLM + Outils). 🛠️00:20:03 - Commandements n°6 & 7 : Machine Learning vs Deep Learning (la fameuse "boîte noire"). ⬛00:24:08 - Commandement n°8 : ChatGPT n'a pas accès à tout Internet (le cas Grok vs Google). 🌐00:26:18 - Commandement n°9 & 10 : L'art du contexte et le coût réel (et caché) de l'IA. 💰00:29:08 - Commandement n°11 : Les biais de l'IA (le mystère des montres bloquées à 10h10). ⌚00:30:01 - Commandement n°12 : L'ère des agents IA (OpenAI Agent Builder, n8n, Make...). 🤖00:31:20 - Conclusion : L'évolution fulgurante de la vidéo IA. 🎬