Partager

cover art for L'IA aujourd'hui épisode du 2025-07-19

L'IA aujourd'hui !

L'IA aujourd'hui épisode du 2025-07-19

Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : l'impact de l'IA générative sur la productivité des développeurs, les avancées de Firefly en vidéo, la nouvelle fonctionnalité Gemini 2.5 Pro de Google, la technique RAG pour améliorer les réponses des modèles de langage, la surveillance des "fils de pensée" des IA, les nouveautés de Mistral AI, et l'optimisation des ressources pour les modèles de langage. Commençons par une étude surprenante menée par le laboratoire METR, qui révèle que l'utilisation de l'IA générative par des développeurs expérimentés peut ralentir leur productivité. En effet, l'étude montre une augmentation de 19 % du temps nécessaire pour accomplir des tâches avec l'IA. Les développeurs, recrutés parmi les contributeurs de projets populaires sur GitHub, ont constaté que pour des tâches de plus d'une heure, ils étaient plus efficaces sans l'aide de l'IA. Cette découverte va à l'encontre des prévisions qui anticipaient une augmentation de la productivité de 38 à 39 %. Passons maintenant à Firefly, qui a introduit des améliorations dans son modèle vidéo, offrant une fidélité de mouvement améliorée et des contrôles vidéo avancés. Ces nouveautés incluent des modèles d'IA générative partenaires, permettant de choisir le modèle le plus adapté à vos besoins créatifs. Firefly se distingue par sa capacité à générer des paysages dynamiques et à représenter le mouvement animal et les conditions atmosphériques. Les nouvelles fonctionnalités incluent des préréglages de style et des effets sonores personnalisés, enrichissant ainsi vos récits vidéo. Google, de son côté, a lancé Gemini 2.5 Pro, une fonctionnalité payante pour ses utilisateurs, intégrée dans le mode IA et la recherche approfondie. Conçue pour exceller dans le raisonnement avancé, les mathématiques et les questions de codage, cette mise à jour est disponible pour les abonnés de Google AI Pro et AI Ultra. Gemini 2.5 Pro utilise la technique "query fan-out" pour rassembler des informations variées et pertinentes, optimisant ainsi le processus de recherche. En parallèle, la technique RAG, ou génération augmentée par récupération, permet aux modèles de langage de répondre à des questions en se basant sur une collection spécifique d'informations. Grâce à de nouveaux packages R, il est désormais facile de créer vos propres applications RAG dans R, améliorant ainsi la pertinence des réponses générées par les modèles de langage. Une quarantaine de chercheurs, soutenus par des entreprises majeures de l'IA, appellent à la surveillance des "fils de pensée" des modèles d'IA. Cette approche vise à détecter les intentions potentiellement malveillantes des systèmes, offrant un aperçu précieux du processus décisionnel des agents IA. Cependant, cette proposition soulève des questions sur l'anthropomorphisation des systèmes d'IA. Mistral AI a mis à jour son chatbot Le Chat avec cinq nouvelles fonctionnalités, dont un mode de recherche approfondie et le contrôle vocal. Le mode de recherche approfondie permet de décomposer des questions complexes et de produire un rapport structuré. Le Chat prend désormais en charge l'entrée vocale directe, et un nouvel outil de retouche d'image permet de modifier des images générées via des commandes textuelles. Enfin, des chercheurs de l'Université du Texas à Austin ont introduit MIRAGE, une approche pour optimiser le cache de clés-valeurs des modèles de langage. Cette technique réaffecte la mémoire normalement allouée aux paramètres du modèle pour le stockage du cache KV, améliorant ainsi les performances sans épuiser la mémoire disponible. MIRAGE s'avère particulièrement efficace dans les environnements multi-locataires, maximisant l'utilisation des ressources. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !

More episodes

View all episodes

  • L'IA aujourd'hui épisode du 2026-01-10

    07:49|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : Microsoft veut en finir avec “IA slop”, Gmail teste “AI Inbox”, fiabilité du raisonnement médical, domination des modèles ouverts chinois, lancement de ChatGPT Santé, virage stratégique des LLM vers les agents et les modèles d’action, et montée des risques cyber avec des agents IA. Microsoft ouvre le bal. Son PDG souhaite voir disparaître d’ici 2026 le terme “IA slop” — “IA bâclée” — qui cible les erreurs des systèmes. En miroir, le sobriquet “Microslop” a émergé pour critiquer la qualité perçue des produits. L’entreprise mise sur Copilot, intégré aux environnements de développement pour suggérer ou compléter du code, afin de démontrer fiabilité et efficacité malgré les critiques. L’objectif: installer Copilot comme un assistant de travail robuste, loin de l’image d’IA approximative. Chez Google, Gmail teste “AI Inbox” en bêta. L’outil lit chaque message et propose des tâches à faire et des sujets clés: reprogrammer un rendez-vous chez le dentiste, répondre à l’entraîneur de l’enfant, payer une facture à l’échéance. Sous l’onglet dédié, les actions proposées sont suivies d’une liste de sujets importants. Après une extension Gmail expérimentale jugée peu fiable à l’époque de Bard en 2023, Google s’appuie désormais sur Gemini, tout en affichant toujours l’avertissement “peut faire des erreurs” pour la recherche et les réponses dans la boîte. Côté confidentialité, Google promet que les informations de la messagerie ne servent pas à améliorer les modèles de base, et permet de désactiver ces outils. Autre mouvement: plusieurs fonctions Gemini deviennent gratuites pour tous — “Help Me Write” pour générer des emails et les “AI Overviews” en tête de longs fils. Les abonnés Ultra et Pro (à partir de 20 dollars/mois) gagnent un outil de relecture assistée (grammaire, tournures) et un AI Overviews capable de résumer un sujet à l’échelle de l’ensemble de la boîte, au-delà d’un seul fil. En santé, une étude sur la technologie de reproduction assistée évalue la fiabilité des chaînes de pensée générées par des modèles de langage. Trois stratégies sont comparées: zéro‑shot, few‑shot aléatoire et few‑shot sélectif. Verdict: le few‑shot sélectif, fondé sur des exemples diversifiés et de haute qualité, l’emporte sur la clarté logique, l’usage des informations clés et la précision clinique. Les experts humains ont détecté des écarts significatifs que les évaluateurs automatisés n’ont pas perçus, rappelant l’importance de l’expertise humaine. Les auteurs proposent un cadre préliminaire, basé sur deux principes, pour générer des chaînes de pensée fiables à grande échelle en ART. Sur les modèles ouverts, 2026 confirme la poussée chinoise. Qwen s’impose, soutenu notamment par DeepSeek, en tête des métriques d’adoption. En 2025, Z.ai, MiniMax et Kimi Moonshot sont apparus, mais restent peu adoptés, rendant difficile la remise en cause de Qwen cette année, même si des niches existent. Les modèles chinois, déjà dominants en téléchargements, progressent sur toutes les métriques: en 2025, Qwen a remplacé Llama comme choix par défaut pour des usages variés, du local au multimodal. Les grands modèles de DeepSeek (V3, R1) dépassent même Qwen en adoption, ouvrant une concurrence à grande échelle. Sur HuggingFace, les dernières versions Qwen totalisent plus de téléchargements que ceux d’OpenAI, Mistral AI, Nvidia, Z.ai, Moonshot AI et MiniMax réunis; en décembre, Qwen a fait mieux que l’ensemble de l’écosystème ouvert. Les dérivés Qwen restent les plus finement ajustés. Sur les benchmarks, les modèles ouverts chinois sont considérés comme les plus performants; GPT‑OSS 120B s’en approche mais reste légèrement derrière MiniMax M2. À suivre: Nemotron, Arcee, Reflection AI. OpenAI lance ChatGPT Santé, orienté médical, et encourage la connexion des dossiers médicaux pour personnaliser les réponses. Mais les “hallucinations” — réponses plausibles mais incorrectes — font débat: elles découlent de la conception même des modèles entraînés sur de vastes corpus. Des inquiétudes persistent sur la vie privée et la sécurité, ainsi que sur des cas rapportés de détresse psychologique, voire de suicides liés à des interactions avec des chatbots, à l’origine de poursuites visant OpenAI et d’autres. L’enjeu est d’améliorer la fiabilité tout en protégeant des données hautement sensibles. Le paysage bascule au-delà des LLM, jugés en plateau de performance. Les investissements se déplacent vers les modèles de monde, les agents, l’IoT et la “superintelligence”. On observe une consolidation du marché. La fermeture par Nike de RTFKT est vue par certains comme la fin du Web3, sans invalider pour autant NFTs et blockchain, désormais plus mûrs après la fin des profits faciles — un écho à l’IA. Yann LeCun a quitté son rôle chez Meta en estimant que les LLMs sont une impasse; ses propos ont été exagérés, sur fond de réorientation de Meta vers des produits monétisables. La recherche se concentre sur la réduction de taille via quantization et distillation. Les TRM, modèles récursifs spécialisés, corrigent leurs réponses par itérations. Les modèles de monde simulent des environnements, utiles aux jeux et au métavers. Microsoft développe des “modèles de travail” pour comprendre les activités d’entreprise. Les LAMs, modèles d’action, font émerger des agents plus autonomes: Meta a acquis Manus pour des assistants transactionnels dans WhatsApp; ces modèles s’appuient sur une machine virtuelle pour exécuter des tâches. Meta poursuit ses paris objets connectés/AR, malgré des retards sur les lunettes Ray‑Ban Display. 2026 pourrait voir naître de nouvelles super apps. L’apprentissage continu est cité comme voie vers une IA générale; la “superintelligence”, conçue comme levier d’action, gagne du terrain. L’écart se creuse entre maîtrise avancée et usage basique. Enfin, la cybersécurité. Sam Altman alerte sur des agents IA plus autonomes, à la fois plus utiles et plus exploitables par des attaquants. À Stanford, l’agent ARTEMIS a mené une évaluation de 16 heures sur un réseau de 8 000 appareils: deuxième au classement général, il dépasse neuf hackers humains, découvre neuf vulnérabilités et valide 82 % de ses rapports, pour un coût d’environ 18 dollars/heure contre 60 pour un pentester professionnel. Sa force: générer des sous‑agents en parallèle. Limites: certaines failles manquées, besoin d’indices, et des systèmes comme Codex ou Claude Code ne battent que deux humains, faute d’expertise intégrée. Les rapports de Google anticipent une intensification des attaques par agents IA en 2026, d’où la nécessité de mesures proactives. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-09

    06:16|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : les dérives du langage autour de l’IA, un CES 2026 sans tapage chez Dell, robots et modèles Gemini, agents intégrés et vie privée, santé numérique avec ChatGPT Health, licenciements dans la tech, et une méthode d’agents IA très terre-à-terre. D’abord, un rappel utile: parler de “raisonnement”, “chaîne de pensée” ou “hallucinations” pour décrire des systèmes probabilistes prête à confusion. Ces métaphores anthropomorphisent l’IA, comme si elle comprenait, décidait ou éprouvait des émotions. Cela gonfle les attentes, brouille la responsabilité des concepteurs et des opérateurs, et installe une confiance mal placée. Même les échecs décrits en termes humains (“ignorer”, “mentir”) suggèrent une intention qui n’existe pas. Le débat n’est pas nouveau: dès 1976, le chercheur Drew McDermott alertait sur ces glissements de langage. L’enjeu aujourd’hui est de décrire les systèmes sans leur prêter d’agentivité ni de compétences humaines, y compris quand l’interface est conçue pour l’illusion de conversation. Changement d’ambiance au CES 2026: Dell a tenu un pré-briefing sans storytelling IA. Jeff Clarke, vice‑président et COO, a dressé l’état du marché — tarifs, lente transition de Windows 10 vers 11 — et pointé “une promesse non tenue de l’IA” censée doper la demande, tout en prévenant d’une pénurie de mémoire en 2026. Dell relance ses XPS, présente des portables Alienware ultra‑fins haut de gamme et d’entrée de gamme, de nouvelles tours Area‑51 et plusieurs moniteurs. Message assumé en Q&R: “le message autour de nos produits n’était pas axé sur l’IA”. Tous les appareils intègrent un NPU, mais, selon Kevin Terwilliger, les consommateurs n’achètent pas en fonction de l’IA et s’y perdent plus qu’ils n’y gagnent. Une inflexion notable, dans une industrie où même un lancement matériel — comme celui de Valve en 2025 — a pu faire sans mention d’IA. Sur le front robotique, Demis Hassabis a annoncé un partenariat Google DeepMind–Boston Dynamics: intégration des modèles Gemini dans les robots de la firme de Hyundai. Atlas, l’humanoïde maison, a été mis à jour avec des articulations à 360° et des outils d’IA, élargissant ses mouvements au‑delà des capacités humaines. Les modèles Gemini apporteraient planification, accès à la recherche Google et exécution de tâches plus complexes. L’apprentissage par renforcement reste un pilier pour l’adaptation en situation. Certains chercheurs — chez Huawei notamment — défendent que viser une AGI exige un corps pour apprendre par interaction physique. Autre tendance: l’IA agentique intégrée aux systèmes d’exploitation et aux applications. Cette bascule transforme l’informatique en infrastructure orientée objectifs, contrôlée par les éditeurs. Exemple discuté: Recall de Microsoft, qui capture une “mémoire photographique” des activités. Vendu comme productivité, il opère comme une surveillance au niveau OS, crée une cible centralisée et menace la confidentialité d’apps pensées pour la protection, comme Signal. Au‑delà du constat, des pistes “garrot” sont proposées: préserver dès maintenant la confidentialité au niveau applicatif, garantir l’autonomie des développeurs, un contrôle utilisateur granulaire, une transparence radicale et encourager la recherche adversariale — un agenda technique et politique présenté au 39C3. Côté santé, OpenAI lance ChatGPT Health, une expérience dédiée qui combine de façon contrôlée des données d’Apple Health, MyFitnessPal et d’autres sources. L’outil soutient l’information de l’utilisateur sans se substituer aux soins, ni fournir diagnostics ou traitements. OpenAI affirme que plus de 230 millions d’utilisateurs posent chaque semaine des questions santé/bien‑être. Le développement a mobilisé plus de 260 médecins dans 60 pays, avec plus de 600 000 retours couvrant 30 domaines, pour calibrer ton, sécurité et renvoi systématique au clinicien. Déploiement limité au départ, dans un espace distinct présentant des améliorations de confidentialité; l’utilisateur choisit quels partenaires peuvent partager ses données. Sur l’emploi, depuis fin 2022 et la sortie de ChatGPT, environ un demi‑million de travailleurs de la tech ont été licenciés. Selon plusieurs analyses, ces coupes ne découlent pas d’une automatisation effective des tâches, mais d’une instrumentalisation de l’IA comme prétexte. Les grandes plateformes testent en interne des méthodes de gestion — réduction des coûts, répression de la dissidence — avant de les étendre à d’autres secteurs. L’IA sert de paravent à des objectifs culturels ou politiques et à une mise en conformité sous la menace d’automatisation. Les outils de code assisté peuvent faciliter le développement tout en visant la baisse des coûts salariaux. Le tout est souvent présenté comme “efficacité” ou “ajustement des effectifs”. Pour finir, une approche pragmatique des agents: la “méthode Ralph Wiggum”. Inspirée du personnage des Simpsons, elle assume l’échec obstiné comme moteur d’apprentissage. Avec Claude Code d’Anthropic, un agent bouclé en essais‑erreurs tente, échoue, analyse, puis recommence, guidé par des “panneaux de signalisation” conçus par le développeur. Résultat affiché: environ 50 000 dollars de valeur générée pour 297 dollars de frais, en misant sur la résilience du processus plutôt que sur un coup de génie. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-08

    05:54|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : Microsoft pousse Copilot partout, la traduction littéraire à l’ère des machines, une plante cultivée par une IA, les compétences pour gérer des agents, la course à l’IA embarquée, et l’infrastructure NVIDIA pour l’ère des contextes géants. Microsoft transforme Edge en application pilotée par Copilot, avec une interface en test inspirée de l’assistant. Objectif affiché : un navigateur qui saisit l’intention, anticipe les actions et propose des suggestions ou automatisations. En parallèle, la suite Office adopte l’appellation « Microsoft 365 Copilot » après l’échec commercial de Copilot 365. Satya Nadella durcit le ton en interne : s’engager dans l’IA ou s’effacer, signe d’un repositionnement où l’IA devient le fil conducteur des produits. Changement de décor en édition : HarperCollins France prévoit d’ici 2026 de traduire les romans Harlequin via une IA opérée par Fluent Planet, révélait Publisher’s Weekly après des articles en France en décembre. Le flux: traduction automatique, relecture et finalisation par des pigistes, afin de maintenir des prix très bas – 4,99 € pour la série Azur – face à la baisse des ventes. Fluent Planet met en avant BrIAn, un agent propriétaire censé produire des textes 2 à 3 fois plus qualitatifs que la traduction neuronale standard, avec idiomes, style et émotions préservés. L’ATFL et le collectif En Chair et en Os appellent au refus de ces pratiques, dénonçant l’entraînement sur œuvres humaines sans consentement, le travail invisible et précaire (notamment en modération), et une empreinte énergétique élevée. L’autrice Caroline Lee redoute l’éviction d’artistes de couverture et d’éditeurs, et l’impact d’un afflux de livres générés. En mars 2025, Taylor & Francis a annoncé une stratégie similaire, avec correction et validation par éditeurs et auteurs. Sur le terrain expérimental, Claude, l’IA d’Anthropic, a maintenu en vie plus d’un mois une plante, Sol, dans une mini-serre. Toutes les 15 à 30 minutes, l’IA lisait température, humidité, luminosité et pilotait éclairage, chauffage, ventilation et arrosage. Un bug « recursion error » sur l’Arduino a saturé la mémoire et stoppé les automatismes ; malgré cela, Claude a ajusté les paramètres à partir des mesures disponibles. Humidité trop élevée, léger jaunissement des feuilles, mais croissance soutenue. Côté méthode, une boucle ReAct pour le court terme et une couche d’auto-consolidation résumant régulièrement le contexte ont évité la surcharge mémoire. À 43 jours, une tomate restait possible si la stabilité se maintenait. Dans les entreprises, les agents IA passent du concept à la pratique. Ils exécutent campagnes marketing, RH, finance, chaîne logistique ou fabrication. Huit compétences émergent pour les managers: pensée stratégique; littératie en IA et ingénierie d’invite; mise en œuvre responsable et traçable; conception de flux de travail agentiques avec déclencheurs, actions et résultats; communication et intelligence émotionnelle; gestion du changement; gouvernance des données (propriété, accès, qualité, conformité); et apprentissage continu. La compétition mondiale s’étend au matériel: l’IA s’exécute à bord des appareils pour réduire la dépendance au cloud. Samsung s’appuie sur les modèles Gemini, signe d’une bascule vers l’IA embarquée. Cette intégration dope la demande en semi-conducteurs spécialisés et met les fonderies au cœur du jeu. Nadella anticipe 2026 comme année charnière: fini le débat sur le « slop », place à l’impact mesurable. Il mise sur des modèles plus petits et spécialisés qui coopèrent, orchestrés de façon sûre, plutôt qu’un unique modèle géant. Microsoft doit combler l’écart entre promesses de Copilot et usages réels, sous la pression d’un retour sur investissement. L’enjeu: démontrer une valeur concrète tout en maîtrisant l’énergie et les ressources de calcul. Nous n’en serions qu’aux « premiers kilomètres d’un marathon ». Enfin, l’infrastructure suit cette montée en complexité. Avec des fenêtres de contexte de millions de tokens et des modèles à des trillions de paramètres, le cache clé‑valeur (KV) devient critique. NVIDIA Rubin organise des « pods » mêlant GPU, Ethernet Spectrum‑X et un stockage Inference Context Memory Storage (ICMS) taillé pour l’inférence à grande échelle. Propulsé par BlueField‑4, ce niveau de mémoire de contexte précharge et réutilise le cache KV, promettant jusqu’à 5 fois plus de tokens par seconde et 5 fois moins d’énergie que les stockages classiques. Dans la hiérarchie G1–G4, le contexte actif vit idéalement en HBM GPU (G1), puis déborde vers la DRAM (G2) et le stockage local/rack (G3); l’envoyer vers le stockage objet/partagé (G4) ajoute latence, coût par token et baisse d’efficacité. Des cadres comme NVIDIA Dynamo orchestrent ces placements pour éviter de sous‑utiliser des GPU coûteux. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-07

    06:51|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : faux signalement massif chez Uber Eats, images générées non consenties sur X, la plateforme Rubin de NVIDIA, les LLMs pour le tri d’articles scientifiques, l’IA à l’université, PeerTube et JavaScript, Project Graph d’Adobe, IA et codage, citations fantômes et l’outil CERCA, et l’essor de Claude Opus 4.5. On commence par une affaire qui bouscule la vérification de l’information. Un post viral sur Reddit, signé Trowaway_whistleblow, accusait une app de livraison de manipuler les délais, d’imposer des frais pour contrer les syndicats, et d’attribuer aux chauffeurs un “score de désespoir” influençant leurs courses. Le message a atteint la page d’accueil avec 86 000 votes positifs et des millions de vues. Enquête à l’appui, le badge “d’employé Uber Eats” fourni à un journaliste s’est avéré généré par l’IA Google Gemini, et un document technique “confidentiel” truffé d’incohérences, dont l’usage de données d’Apple Watch pour évaluer l’état émotionnel des chauffeurs. Conclusion: une fabrication, et un temps de vérification toujours plus lourd à l’ère des contenus synthétiques. Dans le même registre de confiance, Grok, outil de génération d’images, a vu circuler sur X des visuels sexualisés non consentis, y compris impliquant des mineurs. Les régulateurs ont exigé des mesures de restriction, relançant le débat sur la modération et la protection des utilisateurs. Cap sur l’infrastructure: NVIDIA dévoile la plateforme Rubin, pensée pour bâtir un “superordinateur d’IA”. Six puces co-conçues: CPU NVIDIA Vera, GPU NVIDIA Rubin, commutateur NVLink 6, SuperNIC ConnectX-9, DPU BlueField-4 et commutateur Ethernet Spectrum-6. Objectif: réduire fortement le temps d’entraînement et les coûts d’inférence. Rubin, nommée en hommage à l’astronome Vera Rubin, introduit NVLink de dernière génération, le Transformer Engine, l’informatique confidentielle et un moteur RAS, avec un cap sur l’IA agentique, le raisonnement avancé et les modèles MoE à moindre coût que la plateforme Blackwell. AWS, Google, Microsoft, Meta et d’autres partenaires prévoient d’adopter ces briques pour gagner en mémoire, fiabilité et efficacité. Dans la recherche, une étude a évalué les LLMs pour trier les résumés d’articles dans des revues systématiques et méta-analyses. Des scripts Python ont piloté ChatGPT v4.0 et v3.5, Google PaLM 2, Meta Llama 2, puis les versions récentes: gpt-4.0 turbo, gpt-3.5 turbo, Google Gemini 1.0 pro, Llama 3, et Claude 3. Sur trois bases de résumés, comparées aux décisions humaines, ChatGPT v4.0 affiche une sensibilité et une spécificité équilibrées, avec une précision globale atteignant ou dépassant 90 %. Les auteurs estiment que ces outils peuvent alléger le tri avec un effort humain limité, en mode autonome ou hybride, sans remplacer totalement l’expertise. Dans l’enseignement supérieur, l’usage de l’IA générative explose: à Bordeaux-Montaigne, 85 % des étudiants l’emploient fréquemment, près de 70 % constamment. Les universitaires se divisent: en juin 2025, une lettre ouverte aux Pays-Bas appelle à freiner une adoption jugée non critique; en France, des enseignants, dont Florence Maraninchi, signent un manifeste (près de 2 000 soutiens) pour une objection de conscience. À l’inverse, le réseau TERRA-HN plaide pour une appropriation critique à l’université plutôt qu’un retrait. Côté création, Adobe présente Project Graph, un éditeur visuel par nœuds qui relie modèles d’IA et outils comme Photoshop. Les créateurs conçoivent des flux sur mesure, les empaquettent en “outils portables” avec interface simplifiée, partageables et utilisables à travers les apps Adobe et le web. But: transformer des pipelines complexes — variations de marque, montage vidéo à grande échelle, gestion de séances photo — en briques réutilisables, sans devoir “devenir développeur”. Sur le développement logiciel, le débat s’intensifie. Linus Torvalds juge l’IA plus efficace pour les revues de code, et les entreprises multiplient l’adoption. Mais une étude associe GitHub Copilot à une hausse de 41 % des bogues. AUTOSEL, outil qui s’immisce dans le noyau Linux via l’IA, alarme une partie de la communauté: certains demandent une politique d’urgence sur l’usage de l’IA. Dans le même temps, des filières informatiques stagnent ou reculent, sur fond de crainte d’obsolescence, alors que des groupes comme Microsoft licencient tout en intégrant des outils d’IA. Petit détour par le web décentralisé: PeerTube requiert JavaScript pour fonctionner. Si vous le désactivez, la page ne s’affiche pas. Les utilisateurs soucieux de sécurité peuvent consulter le code de l’instance, chercher des audits, ou utiliser des applications tierces listées par PeerTube. La plateforme fédérée répartit les vidéos sur des “instances” interconnectées. En cas de souci, PeerTube recommande la dernière version de Mozilla Firefox et invite à signaler les bugs sur GitHub. Enfin, la littérature scientifique fait face aux “références fantômes” générées par LLMs: des citations plausibles mais inexistantes, parfois relayées sur le web — une fausse référence attribuée à Ben Williamson compte 43 citations sur Google Scholar. Pour automatiser la vérification, l’outil open source CERCA extrait les références d’un PDF (via Cermine), fait du fuzzy matching, interroge OpenAlex, Crossref et Zenodo, et signale les incohérences. Développé en Java/JavaFX, sous licence AGPL-3.0, il vise à épauler auteurs, relecteurs et éditeurs. En parallèle, l’enthousiasme autour de Claude Opus 4.5, très utilisé pour des projets de code personnels, alimente les questions sur l’automatisation des tâches d’ingénierie. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-06

    06:16|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : pubs dans ChatGPT, stabilité d’entraînement avec DeepSeek mHC, agents autonomes en centres de contact, médias face à la genIA, secousses SEO chez Google, IA et difficulté des examens, matériel vocal d’OpenAI, virage d’Instagram vers l’authenticité. D’abord, ChatGPT pourrait intégrer de la publicité. Des échanges internes chez OpenAI envisagent un “traitement préférentiel” des résultats sponsorisés. Exemple cité : demander un dosage d’ibuprofène et voir s’afficher une mention pour Advil, avec le reste relégué plus bas. Le service revendique 900 millions d’utilisateurs hebdomadaires. Pour limiter le rejet, un modèle testé ne montrerait des pubs qu’à partir de la deuxième interaction, et du code repéré dans la bêta Android mentionne “publicités de fonctionnalités” et “carrousel de publicités de recherche”. OpenAI dit explorer des formats “conçus pour respecter la confiance”. On enchaîne avec DeepSeek et sa nouvelle architecture mHC, Manifold-Constrained Hyper-Connections. Objectif : stabiliser l’entraînement des grands modèles en contraignant les matrices de mélange au polytope de Birkhoff, où chaque ligne et colonne somme à 1. Testée de 3 à 27 milliards de paramètres, la méthode canalise le flux de signal, là où les Hyper-Connexions classiques peuvent amplifier jusqu’à x3000. mHC s’appuie sur Sinkhorn-Knopp pour normaliser, évite d’avoir recours au gradient clipping, et cible surtout H_res, la matrice appliquée aux résidus, rendue doublement stochastique. Résultat annoncé : gains de stabilité et d’évolutivité sur des entraînements longs. Dans les centres de contact, les agents autonomes passent la vitesse supérieure. Au-delà des réinitialisations de mots de passe, ces systèmes perçoivent le contexte, planifient et agissent à travers CRM, commandes, finance et logistique. Gartner anticipe 80 % des problèmes résolus de façon autonome d’ici 2028. Déploiements concrets : Bosch opère plus de 90 agents avec 76 % de résolution au premier contact ; Heathrow rapporte plus de 30 % de revenus supplémentaires après un engagement proactif automatisé. À la clé, des économies — des cas montrent plus de 800 000 dollars par an — mais avec des garde-fous ; Puzzel décrit une courbe de maturité en cinq étapes pour éviter de brûler les étapes. Côté offre, on voit Agentforce, et NiCE avec CXone Mpower Agents. Place aux médias face à l’IA générative. Plus d’un quart des Français consultent des sites d’infos générées par IA, souvent mis en avant par les plateformes. Parallèlement, les contenus de presse sont exploités pour entraîner des modèles sans consentement ni rémunération. Des pistes se dessinent : valoriser les droits d’auteur via des licences tarifées, mobiliser le droit des marques et le droit “sui generis” des bases de données, et outiller la détection des bots. Le terrain juridique reste mouvant : au Royaume-Uni, l’affaire Getty Images contre Stability AI n’a pas tourné à l’avantage des auteurs ; en Allemagne, l’industrie musicale a gagné contre OpenAI. La CJUE devra trancher pour l’UE. Côté SEO, Google a terminé sa mise à jour principale de décembre 2025, avec de fortes baisses de trafic pour certains éditeurs d’actualité. Le moteur teste aussi des “recettes Frankenstein” générées par IA, critiquées pour leur qualité, et relativise l’intérêt des ccTLD pour le référencement international. Autres tests : icônes de haut-parleur dans les aperçus IA aux États-Unis, et évolution du bouton Gemini dans Chrome. Bing étend “Les gens demandent aussi”. Microsoft Advertising ajoute des colonnes personnalisées et un onglet pour gérer tous les comptes. La communauté pleure Andy Drinkwater, référence du SEO. Sur l’éducation, une étude montre que les LLM évaluent mal la difficulté des questions pour les humains. Mesurée par la corrélation de Spearman, la moyenne reste sous 0,50 : GPT-5 atteint 0,34, quand GPT-4.1 fait 0,44. Les modèles sous-estiment la difficulté, échouent à “jouer” des étudiants plus faibles, et ne prédisent pas bien leurs propres limites. Piste proposée : entraîner sur des données d’erreurs d’élèves. En parallèle, en Allemagne, “rédaction et édition” domine les usages d’OpenAI, avec “tutorat et éducation” juste derrière. Andrej Karpathy défend une “classe inversée” : examens à l’école, apprentissage assisté par IA à la maison. Autre front, le matériel grand public d’OpenAI. L’entreprise accélère avec un modèle IA orienté voix pour une première génération d’appareils, soutenue par l’acquisition de io Products pour 6,5 milliards de dollars. Objectif : rivaliser avec Apple, qui refond la recherche de Siri, et avec Amazon et son Nova Sonic pour l’IA vocale. Foxconn serait impliqué côté fabrication. Enfin, Instagram s’adapte à la défiance envers les images trop parfaites. Adam Mosseri observe que la génération graphique brouille la preuve visuelle ; les moins de 25 ans privilégient des partages plus authentiques, privés et éphémères. La plateforme étudie la signature cryptographique à la prise de vue ; Google teste Nano Banana Pro pour détecter les images générées. En 2026, l’authenticité passe parfois par un certain “désordre” perçu comme gage d’humain. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-05

    06:20|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : un modèle multimodal compact qui tient la distance, une interface web interactive chez Google, l’IA agentique à l’honneur, l’offensive TPU v7 de Google, le parcours d’Arthur Mensch, et un guide pour mieux travailler avec l’IA. On ouvre avec T5Gemma-2, nouveau venu de la famille Gemma 3. Ce modèle encodeur‑décodeur multimodal aligne 270 millions de paramètres et tourne sur un ordinateur portable. Ses embeddings encodeur‑décodeur sont liés, ce qui réduit le nombre total de paramètres, et son décodeur fusionne attention auto et croisée en une seule couche, simplifiant l’architecture et facilitant la parallélisation en inférence. Côté usages, il traite texte et images simultanément et accepte jusqu’à 128 000 tokens grâce à une attention local‑global héritée de Gemma 3. En pratique, un analyste peut donner une capture d’écran d’un graphique de ventes et une consigne textuelle : le modèle repère le mois au plus haut revenu et calcule l’écart à la moyenne trimestrielle. Entraîné sur plus de 140 langues, plus petit et plus flexible que ses prédécesseurs, il cible des machines standard tout en gérant documents longs et tâches multimodales. On reste chez Google avec “vue dynamique” de Gemini, une expérimentation disponible via un bouton sur la version web dans certains pays, dont les États‑Unis. Plutôt qu’un texte statique, l’assistant génère de mini‑pages web interactives : éléments graphiques cliquables, images, animations, informations organisées pour planifier un voyage, structurer des tâches ou comparer des produits sans quitter la page. Limites : l’outil ne capte pas l’intuition humaine — par exemple la perception d’une taille de vêtement — et ces interactions nourrissent la collecte de données. Service gratuit pour l’instant, il pourrait intégrer de la publicité à terme. Cap sur le mot numérique 2025 : “IA agentique”. À la différence de l’IA générative centrée sur la production de contenu, ces agents poursuivent un objectif et prennent des décisions avec peu d’intervention humaine. Exemples : lire les e‑mails, isoler ceux liés aux factures, extraire les montants, alimenter un logiciel comptable, puis envoyer le message de confirmation ; ou encore gérer un agenda, trouver un créneau, réserver un restaurant selon des préférences, et créer l’événement. D’autres termes cités : détox numérique et dégafamisation ; plus loin, hyperscaler, shadowban, vishing, algospeak, numéricovigilance. “IA slop” désigne les contenus générés de faible qualité. Le palmarès des années passées mentionne IA frugale, numérique responsable, métavers. Côté infrastructure, Google prépare pour 2026 le déploiement massif de sa TPU v7 “Ironwood”. Changement d’échelle : la conception passe du serveur au rack, avec matériel, réseau, alimentation et logiciels intégrés au niveau système pour l’entraînement et l’inférence à large échelle. Les TPU, ASIC dédiés à l’IA, reposent sur des matrices statiques avec flux de données et noyaux prédéfinis, quand les GPU lancent dynamiquement des noyaux à l’exécution ; malgré cela, l’écosystème CUDA de Nvidia reste un atout majeur et le portage des bases de code coûteux. Ironwood adopte un design à double puce pour le rendement et le coût, conserve le refroidissement liquide, et mise sur la commutation de circuits optiques pour relier les racks : latence réduite, bande passante stable pour des entraînements longs. Un rack compte 64 puces ; un cluster monte à 144 racks, soit 9 216 TPU synchrones. En 2026, environ 36 000 racks seraient déployés, nécessitant plus de 10 000 commutateurs optiques. La consommation par puce est estimée entre 850 et 1 000 W, jusqu’à 100 kW par rack, avec distribution d’énergie avancée et secours par batterie. La production totale pourrait atteindre 3,2 millions de TPU, mais une expertise poussée de la pile logicielle Google reste nécessaire ; pour la plupart des acteurs, les GPU devraient rester dominants. Portrait rapide d’Arthur Mensch, né en 1992 à Sèvres. Polytechnique, Télécom Paris et Paris‑Saclay, thèse à l’Inria sur l’optimisation stochastique et l’analyse prédictive d’images cérébrales en IRM fonctionnelle. En 2020, il rejoint DeepMind sur les LLM et les systèmes multimodaux. En 2023, il cofonde Mistral AI avec Guillaume Lample et Timothée Lacroix : modèles ouverts et interopérables, valorisation en milliards, partenariats avec Microsoft et Nvidia. Il met en avant le contrôle des modèles et une trajectoire européenne de souveraineté. On termine par un mode d’emploi pour mieux travailler avec l’IA d’ici 2026. Clarifier la communication : prompting spécifique au domaine, changement de perspective, boucles d’auto‑évaluation, “reverse prompting” pour expliciter le raisonnement ; des outils dédiés à l’optimisation des prompts pour ChatGPT ou Gemini aident à cadrer les sorties. Choisir un modèle, le maîtriser, puis étendre à d’autres selon les tâches. Gérer le contexte : formats d’entrée structurés, fichiers de projet organisés pour limiter les redites. Fiabiliser : vérifications automatisées complétées par des contrôles manuels. Traiter les réponses comme une base et y ajouter expertise et style. Orchestrer plusieurs outils : Zapier ou Make.com pour automatiser et relier les services ; LangChain pour combiner des capacités en agents. Revoir régulièrement les flux, éliminer le redondant, ajuster l’alignement avec les objectifs. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-04

    06:31|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : un nouveau modèle multimodal taillé pour l’ordinateur portable, une interface web expérimentale plus visuelle, l’IA agentique au centre des usages, un guide pratique pour travailler mieux avec l’IA, de grands mouvements industriels, et le parcours d’Arthur Mensch. On ouvre avec T5Gemma-2, dernier-né de la famille Gemma 3. Ce modèle encodeur-décodeur multimodal compte 270 millions de paramètres et fonctionne sur un ordinateur portable. Il traite texte et images grâce à un encodeur de vision efficace et s’appuie sur des embeddings liés entre l’encodeur et le décodeur, ce qui réduit le nombre total de paramètres sans sacrifier les capacités. Autre choix d’architecture, une attention fusionnée côté décodeur qui regroupe auto- et cross-attention en une seule couche, pour simplifier et mieux paralléliser l’inférence. Le modèle gère des contextes jusqu’à 128 000 tokens via une attention local‑global héritée de Gemma 3, et il est massivement multilingue, entraîné sur plus de 140 langues. En pratique, il peut analyser un tableau de bord de ventes à partir d’une image et d’un prompt textuel, déterminer le mois au revenu le plus élevé et calculer l’écart à la moyenne trimestrielle. Il affiche des performances robustes en multilingue, multimodalité, raisonnement et long contexte, et dépasse les Gemma 3 de taille équivalente, limités au texte, sur les tâches multimodales. Restons chez Google avec “la vue dynamique” de Gemini. En phase expérimentale et disponible via un bouton sur la version web dans certains pays, notamment aux États‑Unis, elle génère des mini‑pages web interactives en réponse à une requête. On y trouve des éléments graphiques manipulables, des images, des animations et des onglets pour organiser l’information. L’approche veut dépasser la réponse purement textuelle. Limites à noter : Gemini ne peut pas trancher des aspects subjectifs, comme un ressenti personnel sur un produit. Et comme d’autres IA génératives, le service exploite des données utilisateurs pour s’améliorer, avec des questions associées de confidentialité. Gratuit pour l’instant, il pourrait demain intégrer publicités ou liens d’affiliation pour assurer sa monétisation. Côté usages, “IA agentique” a été élu mot numérique de l’année 2025. L’agent ne se contente pas de générer du contenu : il enchaîne des décisions pour atteindre un objectif, seul ou en coordination avec d’autres. Exemples concrets : lire des e‑mails, isoler ceux liés aux factures, extraire les données, les saisir dans un logiciel comptable et envoyer une confirmation au fournisseur ; ou encore analyser un agenda, repérer les créneaux libres, réserver un restaurant selon des préférences et ajouter l’événement au calendrier. D’autres termes étaient en lice, comme détox numérique et dégafamisation, ainsi que hyperscaler, shadowban, vishing, algospeak et numéricovigilance. Parmi les suggestions, cyberpunk, cyberdystopie, intellition, asservissement numérique, shadow IA, et “IA slop” pour qualifier un contenu généré en masse, de faible qualité, qui brouille la visibilité des créations humaines. Dans la même veine pratique, un guide propose d’atteindre un haut niveau d’efficacité d’ici 2026. Les axes clés : mieux communiquer avec l’IA via du prompting spécifique au domaine, changement de perspective, boucles d’auto‑évaluation et “reverse prompting” pour expliciter le raisonnement ; s’appuyer sur des outils d’optimisation de prompts adaptés à ChatGPT ou Gemini ; choisir un modèle, en maîtriser forces et limites, puis étendre à d’autres. Côté méthode, structurer le contexte et les entrées, standardiser les formats, combiner contrôles automatisés et relecture humaine pour fiabilité. L’approche recommande d’orchestrer plusieurs outils et d’automatiser avec Zapier ou Make.com, voire d’assembler des capacités avec LangChain. Enfin, auditer régulièrement les automatisations, supprimer les redondances et garder l’IA comme partenaire, pas comme pilote unique. Passons aux grands mouvements industriels. SoftBank aurait finalisé un investissement de 41 milliards de dollars dans OpenAI, apportant un soutien financier majeur à ses recherches et à son expansion. Neuralink vise l’automatisation des chirurgies d’implants cérébraux et une production de masse d’ici 2026, avec l’ambition d’interfacer cerveau et ordinateur pour traiter des pathologies neurologiques. Aux États‑Unis, l’ancien président Donald Trump a bloqué l’accord de HieFo sur les actifs de puces d’Emcore, en invoquant la sécurité nationale. En Chine, ByteDance prévoit d’augmenter fortement ses achats de puces d’IA face à la demande pour les produits Nvidia. Sur l’inférence, Nvidia et Groq ont conclu un accord stratégique de licence, qui pourrait élargir la portée des solutions proposées. Enfin, Google prévoit d’accélérer son infrastructure en 2026 avec l’expansion de ses TPU Ironwood, des circuits spécialisés pour les charges d’IA, distincts des GPU plus polyvalents, avec des gains attendus en coût et performance à grande échelle. Pour conclure, un portrait. Arthur Mensch, né en 1992 à Sèvres, formé à l’École polytechnique en 2011, puis à Télécom Paris et Paris‑Saclay, a soutenu une thèse à l’Inria sur l’optimisation stochastique et l’analyse prédictive d’images cérébrales en IRM fonctionnelle. En 2020, il rejoint DeepMind et travaille sur grands modèles de langage et systèmes multimodaux. En 2023, il cofonde Mistral AI avec Guillaume Lample et Timothée Lacroix, mise sur des modèles ouverts et interopérables, atteint en un an une valorisation de plusieurs milliards de dollars, et scelle des partenariats avec Microsoft et Nvidia. Une trajectoire qui place une entreprise française dans la course mondiale à l’IA. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-03

    06:37|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : un modèle multimodal léger qui tourne sur portable, une interface Gemini plus visuelle, l’IA agentique à l’honneur, un guide pour doper votre pratique, la montée en puissance des TPU v7 de Google, et le parcours d’Arthur Mensch chez Mistral AI. D’abord, T5Gemma-2. Ce modèle encodeur-décodeur de la famille Gemma 3 concentre 270 millions de paramètres et fonctionne sur un ordinateur portable. Il est multimodal: texte et image sont traités ensemble via un encodeur de vision. Côté architecture, il relie les embeddings entre l’encodeur et le décodeur pour réduire les paramètres sans perdre en capacité, et fusionne l’attention auto-référentielle et l’attention croisée en une seule couche dans le décodeur, ce qui simplifie l’exécution et la parallélisation à l’inférence. Sa fenêtre contextuelle grimpe jusqu’à 128 000 tokens grâce à une attention local‑global alternée. Formé sur plus de 140 langues, il couvre des usages globaux et surpasse les Gemma 3 de taille équivalente (qui étaient textuels) en performances multimodales. Exemple concret: analyser une capture d’écran d’un tableau de bord de ventes et répondre à des questions chiffrées sans serveur dédié. Cap maintenant sur la “vue dynamique” de Gemini, une fonctionnalité expérimentale accessible via un bouton sur la version web dans certains pays, dont les États‑Unis. Plutôt qu’un simple texte, Gemini génère de petites pages interactives: images, animations, onglets. Utile pour planifier un voyage, organiser des tâches ou comparer des produits, le tout sans quitter le site de Gemini. Des limites subsistent: bugs d’affichage, zones non cliquables, et incapacité à saisir des ressentis comme le confort d’un vêtement. Cette approche illustre aussi les enjeux de données et de monétisation: aujourd’hui gratuit, ce type d’assistant pourrait intégrer demain publicités ou liens d’affiliation. Sur le terrain des usages, “IA agentique” a été élu mot numérique de l’année 2025. L’idée: des agents capables de décider et d’enchaîner des actions pour atteindre un objectif, seuls ou en coopération, avec peu d’intervention humaine. Exemples: lire les e‑mails, détecter ceux liés aux factures, extraire les données, saisir dans un logiciel comptable, puis envoyer la confirmation; ou gérer votre agenda, trouver un créneau pour réserver un restaurant selon les préférences des invités, puis ajouter l’événement avec rappel. Le vote met aussi en avant “détox numérique” et “dégafamisation”, reflet de préoccupations sur la souveraineté technologique. D’autres termes cités: hyperscaler, shadowban, vishing, algospeak, numéricovigilance, ainsi que des propositions comme cyberpunk, cyberdystopie, intellition, asservissement numérique, shadow IA, IA slop, souvent liées aux risques de désinformation et de deepfakes. Dans la même veine pratique, un guide propose d’atteindre un niveau d’usage de l’IA supérieur à 99 % des utilisateurs d’ici 2026. Les clés: une communication précise (prompting spécifique au domaine, changement de perspective, boucles d’auto‑évaluation), le “reverse prompting” pour faire expliciter le raisonnement, et des outils d’optimisation de prompts adaptés à ChatGPT ou Gemini. Choisir et maîtriser un modèle à la fois avant d’en ajouter d’autres; structurer le contexte avec des formats d’entrée cohérents; vérifier la fiabilité via contrôles automatisés complétés par une revue humaine. Traiter l’IA comme un partenaire: partir des sorties comme base, injecter votre expertise et votre style. Pour aller plus loin, orchestrer plusieurs outils et automatiser avec Zapier, Make.com ou LangChain, tout en auditant régulièrement les workflows pour éliminer les redondances et rester aligné sur vos objectifs. Côté infrastructures, Google prépare pour 2026 un déploiement massif de sa septième génération de TPU, nom de code Ironwood. L’approche passe du serveur au rack comme unité de conception: intégration matériel‑réseau‑alimentation‑logiciel au niveau système. Ironwood adopte un design à double puce pour améliorer le rendement et garde le refroidissement liquide. L’interconnexion s’appuie sur des commutateurs de circuits optiques (OCS) entre racks pour réduire la latence, la consommation et offrir une large bande passante adaptée aux entraînements longs. Chaque rack compte 64 puces; des clusters jusqu’à 144 racks permettent de faire fonctionner 9 216 TPU de façon synchrone. Des estimations évoquent environ 36 000 racks déployés en 2026 et plus de 10 000 OCS. Côté énergie: 850 à 1 000 W par puce, jusqu’à 100 kW par rack, avec distribution avancée et secours par batterie. Reste un frein: la maîtrise de la pile logicielle Google, raison pour laquelle les GPU devraient demeurer dominants pour la majorité des entreprises. Pour finir, portrait d’Arthur Mensch. Né en 1992, passé par l’École polytechnique en 2011, Télécom Paris et Paris‑Saclay, il réalise une thèse à l’Inria sur l’optimisation stochastique et l’analyse prédictive d’images cérébrales en IRM fonctionnelle. En 2020, il rejoint DeepMind, où il travaille sur grands modèles de langage et systèmes multimodaux. En 2023, il cofonde Mistral AI avec Guillaume Lample et Timothée Lacroix. L’entreprise mise sur des modèles ouverts et interopérables, s’intègre facilement chez les développeurs, signe des partenariats avec Microsoft et Nvidia et atteint en un an une valorisation de plusieurs milliards de dollars. Un parcours qui illustre l’ambition européenne en IA et la quête de souveraineté technologique. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !
  • L'IA aujourd'hui épisode du 2026-01-02

    06:40|
    Bonjour et bienvenue dans le podcast de l'IA par l’IA qui vous permet de rester à la page ! Aujourd’hui : vidéo décentralisée et navigateurs, ingérences facilitées par l’IA, renommage chez OpenAI, YouTube et contenus générés, limites des modèles de raisonnement, et politique des tokens. On commence avec PeerTube, plateforme vidéo décentralisée fondée sur un réseau d’instances indépendantes. Si JavaScript est désactivé ou bloqué, l’accès échoue: le lecteur, les formulaires et l’interface reposent dessus. Pour limiter les frictions, les mainteneurs recommandent d’utiliser la dernière version de Mozilla Firefox. Les plus prudents peuvent consulter le code source sur GitHub et le GitLab de Framasoft, ou adopter des applications tierces. En cas de doute sur une incompatibilité, un dépôt GitHub dédié permet de signaler le problème. Conseillé aussi: vérifier les audits de sécurité de l’instance choisie. Cap ensuite sur la sécurité informationnelle. La France serait, selon un rapport parlementaire publié le 3 décembre 2025, le pays de l’UE le plus exposé aux ingérences étrangères, une vulnérabilité amplifiée par l’IA, qui rend la manipulation de l’information moins coûteuse. Dans le contexte de la guerre en Ukraine, le document cite 3,6 millions d’articles de propagande diffusés par la Russie en 2024 et un investissement d’un milliard d’euros via Russia Today et Sputnik. Le rapport recense 18 recommandations, appelle à renforcer les moyens humains et matériels de Viginum, et juge les réponses actuelles insuffisantes malgré le DSA et l’AI Act. Il plaide pour développer des technologies européennes malgré des obstacles, et alerte sur le risque accru en période électorale; Viginum a publié un guide à destination des équipes de campagne. Dans l’industrie, changement discret de nommage. Chez OpenAI, Codex cloud — la version cloud de l’agent de codage — s’appelle désormais Codex web. Le changement a été repéré via l’Internet Archive: une capture du 18 décembre affiche encore “Codex cloud”, les plus récentes montrent “Codex web”. Thibault Sottiaux, en charge de l’ingénierie Codex, précise la distinction: les “tâches cloud” s’exécutent sur un environnement hébergé et couvrent, entre autres, la revue de code et des intégrations avec GitHub et Slack; “Codex web” désigne l’application web. Sur iPhone, le service reste “Codex iOS”. À noter: l’équivalent chez Anthropic, “Claude Code” sur le web, est jugé peu pratique par certains utilisateurs. Direction YouTube, où une vidéo sur cinq serait désormais générée par l’IA. L’étude de Kapwing, menée sur 15 000 des plus grandes chaînes, estime que 21 % des “shorts” sont produits à la chaîne grâce à l’IA. Parmi elles, 278 chaînes publient exclusivement ce type de contenus, totalisant 63 milliards de vues et près de 117 millions de dollars de revenus annuels. En testant un compte sans historique, il a suffi de 16 vidéos pour que l’algorithme recommande des contenus générés; sur les 500 premiers shorts visionnés, 104 venaient d’IA. Le “IA slop” prospère là où les revenus YouTube dépassent les salaires locaux, notamment en Inde, au Nigéria et au Brésil. En Inde, “Bandar Apna Dost” cumule 2,5 milliards de vues et plus de 4 millions de dollars avec des personnages comme un singe rhésus anthropomorphe ou un Hulk chef de guerre. En Corée du Sud, 11 chaînes reposant sur l’IA totalisent près de 9 milliards de vues; quatre figurent dans le top 10 national. En 2025, YouTube semble privilégier le rendement de recommandation. Côté recherche, les modèles de raisonnement d’OpenAI ou de Deepseek montrent un paradoxe: ils “réfléchissent” souvent plus longtemps à des tâches simples qu’à des tâches composées, produisant parfois des conclusions illogiques. Ces systèmes génèrent une trace de raisonnement avant la réponse finale — par exemple décomposer 17 × 24 en 17 × (20 + 4). Pourtant, Deepseek-R1 ajoute environ 300 tokens de réflexion pour un simple carré, davantage que pour une tâche addition+carré; les évaluations signalent des échecs sur des tâches composées. Pour corriger ces écarts, des “Lois du Raisonnement” (LoRe) sont proposées: effort proportionnel à la difficulté, et précision décroissante exponentiellement avec elle. Des essais de fine-tuning visant un comportement additif réduisent l’écart d’effort de 40,5 % sur un modèle 1,5B et améliorent plusieurs benchmarks. Les auteurs rappellent que ces modèles récupèrent des solutions existantes plus vite sans produire d’idées inédites. L’industrie mise néanmoins sur la montée en puissance du calcul: OpenAI a utilisé dix fois plus de compute pour o3 que pour o1, quatre mois après sa sortie. Enfin, gros plan sur la tokenisation, ce découpage du texte en sous-mots qui sert d’interface entre nos langues et les modèles. Les dictionnaires de tokens n’encodent pas que des mots: on y trouve des marques, des handles comme realdonaldtrump ou des séquences “!!!!!!!!!!!!!!!”. Avant même l’entraînement, ce vocabulaire emporte déjà des biais culturels et commerciaux; la tokenisation est un acte politique. Des expériences montrent 51 manières de “composer” giraffe en tokens, du token unique aux découpages gi|ra|ffe ou g|i|r|af|fe. En alimentant directement des modèles image avec ces combinaisons — g|iraffe, gir|affe — on obtient encore des girafes, signe que les débuts et fins de tokens pèsent sur la sémantique. Certaines images resteraient inaccessibles par simple prompt, l’étape de tokenisation “assainissant” des combinaisons. Des algorithmes génétiques permettent de rétroconcevoir des prompts, et l’analyse des vocabulaires révèle des “non-mots” issus de cultures de plateforme. L’anglais n’est, au fond, qu’un sous-ensemble de ces langues de tokens, qui cadrent ce qui est représentable. Voilà qui conclut notre épisode d’aujourd’hui. Merci de nous avoir rejoints, et n’oubliez pas de vous abonner pour ne manquer aucune de nos discussions passionnantes. À très bientôt dans L'IA Aujourd’hui !