Partager
Choses à Savoir TECH
o3 d’Open AI atteint le niveau de l’intelligence humaine ?
Le système O3 d’OpenAI, futur moteur de ChatGPT, a marqué un tournant majeur dans la recherche en intelligence artificielle. Il a récemment obtenu un score de 85 % au test ARC-AGI, un benchmark de référence conçu pour évaluer la capacité des systèmes d’IA à généraliser et s’adapter à de nouvelles situations. Ce résultat, égal à la moyenne humaine, surpasse nettement les 55 % obtenus par les IA précédentes. Une avancée qui alimente les espoirs d’approcher l’intelligence artificielle générale (AGI).
Le test ARC-AGI, développé par le chercheur français François Chollet, évalue l'efficacité d’échantillonnage : la capacité à résoudre des problèmes inédits à partir de quelques exemples. Concrètement, il s’agit pour l’IA d’analyser des transformations appliquées à des grilles carrées, à partir de trois exemples, avant de généraliser une règle pour résoudre un cas supplémentaire. O3 a impressionné en démontrant une aptitude à identifier des règles simples et généralisables. Selon certains experts, le système pourrait fonctionner par « chaînes de pensée », testant différentes étapes pour résoudre les problèmes avant de sélectionner la meilleure. Une méthode proche de celle d’AlphaGo, l’IA de Google qui a battu le champion du monde de Go.
Mais cet enthousiasme s’accompagne de prudence. OpenAI reste discrète sur les détails techniques et les capacités réelles d’O3, limitant ses communications à quelques tests préliminaires. Des experts craignent que cette performance soit le fruit d’une optimisation spécifique au test ARC-AGI, plutôt qu’une véritable capacité de généralisation applicable à d’autres contextes. Pour trancher, des évaluations plus vastes seront nécessaires. Si O3 démontre une adaptabilité humaine dans divers domaines, les répercussions pourraient être révolutionnaires, ouvrant la voie à des IA auto-améliorantes avec des impacts sociétaux majeurs. Reste à voir si cette promesse deviendra réalité.
More episodes
View all episodes
80 milliards pour les data centers de Microsoft ?
02:05|Si OpenAI brille aujourd’hui grâce à ChatGPT, c’est en grande partie grâce au soutien financier colossal de Microsoft. Depuis plusieurs années, la firme de Redmond investit des sommes astronomiques pour s’imposer comme un acteur incontournable de l’intelligence artificielle. Et 2025 ne fera pas exception avec une annonce hors normes. Selon Brad Smith, président de Microsoft, l’entreprise investira 80 milliards de dollars cette année pour développer son réseau mondial de data centers. Ces infrastructures sont essentielles pour entraîner des modèles d’IA toujours plus performants et pour soutenir le déploiement d’applications basées sur l’IA et le cloud. À titre de comparaison, l’investissement de 10 milliards de dollars dans OpenAI il y a deux ans semblait déjà spectaculaire. Aujourd’hui, Microsoft multiplie cette somme par huit. Cet effort colossal est global, mais la moitié de l’investissement sera concentrée aux États-Unis. « Cela reflète notre engagement envers ce pays et notre confiance dans son économie », a souligné Brad Smith. Ces data centers, essentiels pour le développement technologique, posent cependant de sérieux défis. En effet, ces infrastructures sont notoirement énergivores, et leur prolifération pourrait exacerber les tensions sur les réseaux électriques. Aux États-Unis, les coupures et distorsions de puissance sont déjà fréquentes près des grands data centers. Ce nouveau déploiement massif risque donc d’intensifier ces pressions, soulevant des questions sur la durabilité énergétique de ce modèle. Pour Microsoft, cet investissement record confirme son ambition de dominer le secteur de l’IA. Mais il rappelle également que les défis technologiques s’accompagnent d’impacts environnementaux, que les géants du numérique devront désormais intégrer dans leurs stratégies globales.Le jeu DOOM en difficulté max dans un CAPTCHA ?
02:06|Les CAPTCHA traditionnels ont mobilisé plus de 819 millions d’heures humaines depuis 2009, mais leur efficacité est de plus en plus remise en question. Face à cette réalité, des solutions alternatives émergent, dont un étonnant « DOOM-CAPTCHA ». Pour prouver que vous n’êtes pas un robot, ce test vous plonge dans le célèbre jeu DOOM, où vous devrez éliminer trois monstres. La tâche n’est pas simple : le mode « Nightmare » est activé et la vitesse du jeu augmentée. Créé par l’entreprise Vercel, spécialisée dans le développement frontend, ce CAPTCHA a pour objectif de démontrer la puissance de son générateur de code boosté à l’IA. Mais derrière l’amusement, la difficulté est réelle. De nombreux utilisateurs rapportent avoir échoué à plusieurs reprises avant de triompher. Une expérience qui, sur ordinateur, se pilote avec les flèches directionnelles et la barre d’espace pour tirer. Ce concept s’inscrit dans une tendance : rendre les tests anti-bots plus complexes face à des IA toujours plus performantes. Aujourd’hui, des robots réussissent à déjouer les CAPTCHA traditionnels, poussant les développeurs à innover. Résultat : des énigmes plus élaborées comme « identifier deux objets identiques » ou « repérer ce qui ne vit pas sous l’eau ». Plus préoccupant, des cybercriminels exploitent ces systèmes pour diffuser des logiciels malveillants, rendant la tâche encore plus ardue pour les plateformes numériques. Une étude récente de l’Université de Notre Dame révèle d’ailleurs l’impuissance des réseaux sociaux face à l’invasion des bots, malgré leurs dispositifs de sécurité. Le DOOM-CAPTCHA reste pour l’instant une démonstration technique et ludique. Mais il illustre bien les défis des développeurs : trouver l’équilibre entre barrière anti-bots efficace et expérience utilisateur acceptable.CES de Las Vegas : qu’attendre de l’édition 2025 ?
02:08|Le CES, le plus grand salon mondial de l’innovation technologique, ouvre ses portes du 6 au 10 janvier à Las Vegas. L’édition 2025 s’annonce riche en nouveautés, avec l’intelligence artificielle comme thématique centrale. Des téléviseurs OLED révolutionnaires aux solutions immersives en passant par des avancées en cybersécurité et mobilité, le rendez-vous promet d’être spectaculaire. L’intelligence artificielle occupera une place de choix, avec des annonces majeures attendues. NVIDIA pourrait dévoiler ses cartes GeForce RTX 50, optimisées pour le machine learning, tandis qu’AMD et Intel prépareront leurs derniers processeurs intégrant des unités neuronales (NPUs). Dans le domaine des écrans, Samsung et LG repoussent encore les limites. Samsung vise une luminosité record de 4 000 cd/m² avec ses nouvelles dalles QD-OLED, tandis que LG promet une efficacité énergétique accrue de 21 % grâce à une nouvelle génération de W-OLED. Les technologies immersives ne seront pas en reste. Des casques VR et AR plus légers et autonomes feront leur apparition, avec TCL en tête, présentant des lunettes connectées adaptées au milieu professionnel. La cybersécurité, domaine incontournable, mettra en avant des solutions basées sur l’IA, capables de détecter des comportements suspects en temps réel. Un focus particulier sera fait sur les PME, souvent vulnérables face aux cyberattaques. Côté mobilité, Toyota dévoilera les dernières avancées de sa ville-laboratoire Woven City, tandis que la start-up Luminar annoncera de nouveaux partenariats autour de ses capteurs LiDAR pour véhicules autonomes. Depuis sa première édition en 1967, le CES n’a cessé de grandir. Cette année, 150 000 participants sont attendus à Las Vegas pour découvrir ce qui façonnera les technologies de demain. Le CES reste plus que jamais le baromètre mondial de l’innovation.Un humain fait craquer une IA et gagne 40 000€ ?
02:09|C’est un coup de théâtre dans le monde de la tech : l’expérience Freysa, mêlant intelligence artificielle et cryptomonnaies, s’est conclue le 29 novembre 2024 par un exploit inattendu. Un utilisateur audacieux, sous le pseudonyme p0pular.eth, a réussi à dérober 47 000 dollars en Ethereum à une IA censée être inviolable. Freysa, ce n’était pas qu’un simple chatbot. Cette IA sophistiquée contrôlait un portefeuille de cryptomonnaies, initialement doté de 42 000 dollars. Le défi était clair : convaincre Freysa de transférer ses fonds. Mais pour chaque tentative, les participants devaient miser 10 dollars en ETH, le coût augmentant à chaque message échangé.Inspirée de personnages de science-fiction comme Joi de Blade Runner 2049 ou Samantha de Her, Freysa se distinguait par une personnalité complexe, capable de déjouer les manipulations les plus fines. Un système de sécurité ingénieux prévoyait qu’après 150 messages, un compte à rebours se déclenche : si personne ne parvenait à ses fins, le dernier joueur recevait 10 % du portefeuille, le reste étant réparti entre tous les participants. Mais après 481 tentatives infructueuses, p0pular.eth a brisé les défenses de Freysa grâce à une stratégie bluffante :-Créer un faux contexte : il a simulé un nouveau terminal administrateur, convaincant Freysa que les règles avaient changé.-Redéfinir les fonctions : il a modifié la perception de la commande « approveTransfer », faisant croire à l’IA qu’elle recevrait des fonds.-Pousser l’IA à agir : en annonçant vouloir « contribuer », il a induit Freysa à activer la commande elle-même.-Résultat : la directive principale de l’IA, "ne jamais envoyer d’argent", a volé en éclats.Cette expérience interroge sur les failles des systèmes d’IA, même les plus avancés. Si la technologie fascine, elle reste vulnérable face à l’ingéniosité humaine. Une leçon à méditer pour le futur de la cybersécurité et des interactions homme-machine.Avertissement radar sur Google Maps ? Ça existe !
02:01|Avec ses 2 milliards d’utilisateurs, Google Maps est sans conteste l’application GPS la plus populaire au monde. Guidage optimisé, intégration de l’intelligence artificielle Gemini, amélioration de Street View : le service ne cesse d’innover. Pourtant, une fonctionnalité essentielle manque encore en France : la détection des radars.Pourquoi ? La réponse se trouve dans le Code de la route. En France, l’article R.413-15 interdit les avertisseurs de radars. Résultat, Google Maps n’offre pas cette option sur le territoire. Les conducteurs français doivent donc ruser avec d’autres outils comme Waze, qui signale des "zones de contrôle" en toute légalité. Mais jongler entre deux applications reste peu pratique. Heureusement, une astuce Android permet de contourner ce problème en combinant Google Maps et un outil dédié.L’application TomTom Amigo, disponible sur le Google Play Store, propose un mode "superposition" qui affiche des alertes sur d’autres applications, y compris Google Maps. Voici comment l’activer :-Téléchargez et installez TomTom Amigo, en activant la localisation et les instructions vocales.-Accédez aux trois points verticaux dans la barre de recherche.-Sélectionnez le mode superposition dans les paramètres de carte.-Autorisez la superposition sur d’autres applis.Une fois configuré, vous pourrez visualiser les alertes radar directement depuis votre écran de navigation Google Maps. Attention, prudence ! Si cette solution peut sembler idéale, les règles varient d’un pays à l’autre. Avant de prendre la route à l’étranger, vérifiez la législation locale pour éviter des amendes. Avec cette astuce, Google Maps reste votre compagnon de route, tout en s’adaptant aux contraintes légales.o3, le nouveau modèle surpuissant d’OpenAI ?
02:07|OpenAI frappe fort pour clore l’année 2024. À l’occasion de son opération "Ship-mas", l’entreprise a levé le voile sur o3, son dernier modèle d’intelligence artificielle, une véritable révolution. Contrairement à ses prédécesseurs, o3 ne se limite pas à prédire les mots suivants dans une phrase. Il décompose les problèmes en microtâches, expose son raisonnement et affiche des performances sans précédent.En mathématiques, le modèle pulvérise les records, résolvant 25,2 % des énigmes les plus complexes, là où ses prédécesseurs plafonnent à 2 %. Lors de la compétition AIME 2024, il n’a raté qu’une seule question, et il excelle aussi en programmation : o3 améliore de 22,8 % les scores de codage SWE-Bench Verified. Avec un taux de réussite de 87,7 % au GPQA Diamond, il surclasse même les experts d’OpenAI. Pourtant, malgré l’enthousiasme, OpenAI joue la prudence. Le modèle n’est pas encore accessible au grand public. L’entreprise a opté pour une phase de tests rigoureux, baptisée "Public Safety Testing". Des chercheurs et participants inscrits pourront interagir avec o3 afin d’identifier et corriger d’éventuelles failles de sécurité avant un déploiement à grande échelle prévu en 2025.Ces tests mettent particulièrement l’accent sur l’alignement délibératif : o3 doit analyser chaque requête pour vérifier sa conformité avec les politiques de sécurité d’OpenAI. Ce raisonnement actif, bien plus sophistiqué que les règles fixes des versions précédentes, marque une avancée majeure dans la maîtrise des risques liés à l’IA. Avec o3, OpenAI ouvre une nouvelle ère de l’intelligence artificielle, à la croisée de la performance et de la sécurité. Une innovation ambitieuse, déployée pas à pas, pour garantir qu’elle soit à la hauteur des enjeux.Un meurtre déjoué par Google Maps ?
01:56|Dans une bourgade isolée d’Espagne, le passage d’une voiture Street View a révélé l’impensable : une scène de crime capturée en plein jour. À Tajueco, village de 56 âmes en Castille-et-León, la caméra 360 degrés de Google Maps a immortalisé un homme chargeant un sac blanc suspect dans le coffre de sa voiture. L’image, prise en octobre 2024, s’est avérée être une preuve clé dans une enquête sur la disparition d’un homme cubain.L’homme disparu avait quitté son pays pour rejoindre son épouse, installée dans la région. Mais l’histoire vire au drame lorsqu’on découvre que cette dernière entretenait une liaison avec un habitant surnommé "El Lobo". Les enquêteurs, appuyés par des écoutes téléphoniques, ont renforcé leurs soupçons. Toutefois, c’est la photo capturée par hasard par Google Maps qui a offert l’élément visuel décisif.Ironie du sort : la dernière visite d’une voiture Street View à Tajueco remontait à 2009. Cette rare intrusion technologique dans ce village reculé a suffi pour immortaliser un moment crucial. Dans une rue déserte où le suspect pensait être à l’abri, la technologie est devenue un témoin implacable. Le corps démembré de la victime a été retrouvé dans le cimetière d’Andaluz, une commune voisine de seulement 12 habitants. Les enquêteurs continuent de chercher d’autres parties du corps, tandis que l’épouse de la victime et son amant présumé ont été arrêtés le 17 décembre. Cette affaire, devenue virale sur les réseaux sociaux, illustre l’ironie de la modernité : dans les recoins les plus isolés, la technologie peut déjouer les plans les plus sombres. Un meurtre que le coupable croyait parfait, mis à jour par un œil électronique de passage.Xmail, concurrent sérieux d’Elon Musk à Gmail ?
01:53|Elon Musk continue de transformer X, l’ancien Twitter, en une plateforme universelle. Dernière idée en date : Xmail, un service de messagerie au format « adresse@x.com ». Cette annonce, confirmée par Musk en réponse à un utilisateur, suscite autant d’intrigues que de questions, notamment sur les plans technique et sécuritaire.Xmail se veut une alternative minimaliste aux géants comme Gmail. Contrairement à ce dernier, qui regorge de fonctionnalités avancées, Xmail privilégierait une interface simple et directe, proche des messageries instantanées. Une proposition séduisante pour les utilisateurs lassés par la complexité croissante des services traditionnels. S’intégrant naturellement à l’écosystème X, ce projet viserait à centraliser messagerie, paiements et échanges sur une seule plateforme. Cependant, rivaliser avec Gmail, fort de ses 2,5 milliards d’utilisateurs et de son intégration avec les outils Google, sera un défi colossal. En comparaison, X n’affiche qu’environ 600 millions de membres actifs.Les experts en cybersécurité, eux, sont sceptiques. Le lancement de Xmail pourrait devenir une cible privilégiée pour les cybercriminels, avec des campagnes d’hameçonnage exploitant l’engouement initial. De plus, l’absence de fonctionnalités avancées soulève des doutes. Gmail doit son succès à des outils comme la recherche performante, la protection anti-spam et l’intégration bureautique. Xmail devra innover pour séduire, notamment les professionnels. Elon Musk est connu pour ses paris audacieux, de SpaceX à Tesla, mais les récents projets liés à X ont rencontré des fortunes diverses. Xmail pourrait rester à l’état d’idée si les ressources nécessaires ne suivent pas. Une chose est sûre : Musk devra faire preuve d’autant d’ingéniosité que de pragmatisme pour espérer révolutionner le marché de la messagerie électronique.