Partager

cover art for Comment empêcher une IA de s'entraîner sur votre site ?

Choses à Savoir TECH

Comment empêcher une IA de s'entraîner sur votre site ?

L'essor de l'IA générative a poussé les entreprises du secteur à utiliser des robots pour pratiquer le « scraping », c'est-à-dire l'extraction de contenus en ligne. Cette méthode, qui accélère l'apprentissage des IA, est souvent perçue comme intrusive et opaque. Pour contrer ce phénomène, les propriétaires de sites cherchent des solutions efficaces. C'est là qu'intervient Cloudflare, une société de sécurité et de performance web, qui propose désormais une solution pour bloquer ces robots.


De nombreux clients de Cloudflare souhaitent empêcher les robots d'IA de naviguer librement sur leurs sites, même lorsque ceux-ci respectent les règles. Les principaux robots concernés incluent Bytespider (de ByteDance, propriétaire de TikTok), Amazonbot, ClaudeBot et GPTBot, qui génèrent le plus grand nombre de requêtes. En réponse à la demande croissante de protection de la propriété intellectuelle, Cloudflare a introduit une nouvelle fonctionnalité très facile à utiliser : un bouton pour bloquer ces robots IA.


Dans la section Sécurité de son service, sous l'onglet Robots, Cloudflare a ajouté un bouton intitulé « AI Scrapers and Crawlers ». Ce bouton empêche les robots de collecter le contenu des sites pour des applications d'IA, comme la formation de modèles. Pour activer cette option, il suffit d'appuyer sur le bouton correspondant. L'option est disponible pour tous les utilisateurs de Cloudflare, qu'ils soient clients payants ou gratuits. Cloudflare s'engage également à mettre à jour régulièrement cette fonctionnalité. Dès qu'une nouvelle empreinte de robot dédiée à la formation de modèles IA sera identifiée, la société mettra à jour son service pour offrir une protection continue et renforcée à ses utilisateurs.

More episodes

View all episodes

  • Elon Musk et NVIDIA lancent le calculateur le plus puissant du monde ?

    02:01|
    Le supercalculateur développé par Elon Musk en partenariat avec Nvidia fait sensation, mais suscite aussi de vives inquiétudes. Présenté par Musk comme le plus grand supercalculateur au monde dédié à l’intelligence artificielle, Colossus, son nom, marque un tournant technologique, mais aussi environnemental.Sur X, Musk a révélé que Colossus, lancé par son groupe xAI pour alimenter l’IA « non woke » Gork, compte 100 000 unités de traitement graphique (GPU). Cela en fait, selon lui, le supercalculateur IA le plus puissant du monde. Pour comparaison, le supercalculateur Jean Zay du CNRS, considéré comme le plus performant en France, affiche 3 000 GPU et 60 000 cœurs CPU, très loin des capacités annoncées de Colossus. Et Musk ne compte pas s’arrêter là : il prévoit de doubler la puissance de sa machine pour atteindre 200 000 GPU dans les prochains mois, assurant ainsi une position dominante sur le marché.Cependant, cette course à la puissance ne se fait pas sans conséquences. De nombreux experts expriment leur inquiétude quant à l’impact environnemental de Colossus, notamment dans la ville de Memphis où il est installé. La région, déjà confrontée à des problèmes de pollution, pourrait voir la situation s’aggraver. Selon CNBC, xAI aurait installé 18 turbines à gaz sans permis, générant 130 tonnes d’oxydes d’azote par an, une quantité suffisante pour alimenter 50 000 foyers. Ces installations non réglementées ajoutent à la crainte que la quête de la suprématie technologique ne crée des désastres environnementaux majeurs. Si Colossus impressionne par ses performances, les risques qu'il présente sur le plan écologique pourraient bien ternir cette avancée dans l’intelligence artificielle.
  • X.com (Twitter) bientôt interdit en Europe ?

    01:54|
    Twitter, ou plutôt X depuis son rebranding, va perdre près de 22 millions d’utilisateurs au Brésil en cette rentrée 2024. La raison ? Un juge de la Cour suprême brésilienne a ordonné le blocage du réseau social dans tout le pays. À l'origine de cette décision, le refus d’Elon Musk de nommer un représentant légal au Brésil, une injonction pourtant claire de la justice locale. Résultat, X se retrouve hors service dans la plus grande économie d'Amérique latine, créant ainsi un précédent qui pourrait bien inspirer d'autres nations.L'interdiction s'applique non seulement à l’accès direct à la plateforme, mais aussi aux tentatives de contournement, comme l’utilisation de VPN ou de proxy. En réponse à ce blocage, les utilisateurs brésiliens se sont massivement tournés vers des alternatives comme Threads de Meta et surtout Blue Sky. Ce dernier a d’ailleurs vu son nombre d’abonnés exploser avec plus d’un million de nouveaux utilisateurs en seulement trois jours. Le portugais, langue officielle du Brésil, est rapidement devenu l’une des plus utilisées sur la plateforme.Cette situation au Brésil pourrait ouvrir la voie à d’autres blocages dans le monde. En Europe, les tensions entre Elon Musk et la Commission européenne ne cessent de croître. En août, le commissaire Thierry Breton avait adressé une mise en garde à Musk concernant ses obligations légales. Ce à quoi le milliardaire avait répondu de manière provocante sur X. Aujourd’hui, avec un pays ayant effectivement imposé une interdiction, l’Union européenne pourrait être tentée de suivre cet exemple. Et si cela se produit, ce sont encore des millions d’utilisateurs que X pourrait perdre, au profit de ses concurrents.
  • Telegram supprime sa pire fonction utilisée pour le crime ?

    01:48|
    Telegram a récemment supprimé l’une de ses fonctionnalités les plus controversées, « People Nearby » (Personnes à proximité). Ce changement intervient peu après l’arrestation à Paris de son fondateur et PDG, Pavel Durov, accusé d’avoir insuffisamment modéré la plateforme et ainsi facilité certaines activités criminelles. Telegram, longtemps perçu comme un bastion de liberté sur Internet, fait désormais face à des accusations graves.La fonctionnalité « People Nearby » permettait aux utilisateurs de découvrir des groupes locaux et d’échanger des contacts selon leur position géographique. Si l’idée semblait séduisante, elle a rapidement été détournée par des escrocs, des dealers et des proxénètes. Bien que Telegram affirme que cette option n’était utilisée que par 0,1 % des utilisateurs, elle est devenue un véritable casse-tête pour les modérateurs et un terrain fertile pour les abus.Pour remplacer ce service, Telegram envisage de lancer « Businesses Nearby », un outil destiné à permettre aux entreprises légitimes et vérifiées de proposer leurs produits et services. Cette initiative, qui ressemble à une version modernisée des Pages Jaunes, vise à redorer l’image de la plateforme. Cependant, des interrogations subsistent sur la capacité de Telegram à empêcher cette nouvelle fonctionnalité de devenir un autre terrain de chasse pour les arnaqueurs. Au-delà de cette suppression, Telegram semble en pleine transformation. Autrefois fier de sa politique de non-intervention, le réseau s’engage désormais à améliorer sa modération et à encourager le signalement de contenus problématiques. Pavel Durov lui-même a défendu la plateforme, affirmant que Telegram n’est pas l’« anarchie digitale » dépeinte par certains, et que des millions de publications nuisibles sont supprimées chaque jour.
  • De la musique créée par l’IA, écoutée par des robots, et un chèque de 10 millions ?

    02:03|
    Le 5 septembre 2024, Michael Smith, un musicien de 52 ans, a été arrêté par la justice fédérale américaine dans une affaire mêlant intelligence artificielle et fraude musicale. Accusé d’avoir généré 10 millions de dollars en royalties grâce à de fausses écoutes sur des morceaux créés via IA, Smith fait face à de lourdes charges.Dans l'industrie musicale, il est souvent difficile de vivre de son art, avec des revenus modestes par écoute sur des plateformes comme Spotify, où chaque stream rapporte entre 0,003 et 0,005 dollar. Smith, lui, a trouvé une méthode plus lucrative mais frauduleuse. Il aurait utilisé l’IA pour générer des morceaux, puis acheté des milliers de faux utilisateurs pour gonfler artificiellement le nombre d’écoutes, engrangeant ainsi des millions de royalties. Selon des emails datant de 2018, il aurait sollicité l’aide d’un collaborateur dans l’industrie musicale et d’un PDG d’une société spécialisée dans la musique par IA pour accélérer la production de titres.Une fois les morceaux créés et renommés pour paraître plus authentiques, Smith aurait activé des bots pour écouter en boucle ses titres, générant des revenus frauduleux. En 2024, ce stratagème lui aurait rapporté 10 millions de dollars avant que les autorités ne mettent fin à cette opération. Déjà en proie à des controverses liées aux droits d’auteur dans la musique assistée par IA, l’industrie musicale voit cette affaire comme un nouvel enjeu. Smith, inculpé de blanchiment d’argent et de fraude électronique, risque jusqu’à 20 ans de prison par chef d’accusation. Lors de son audition, il a nié toute malversation, déclarant : « C’est complètement faux et absurde ! ».
  • La Chine a trouvé le moyen d’obtenir les puces IA d’NVIDIA ?

    01:55|
    Alors que Washington intensifie ses efforts pour limiter l'accès de Pékin aux équipements d'intelligence artificielle (IA) de pointe, la Chine semble toujours un pas en avant. Les décrets du gouvernement Biden, imposant des restrictions sur la technologie américaine, ont poussé les entreprises et ingénieurs chinois à chercher des solutions alternatives pour rester compétitifs dans cette course technologique.Face à la flambée des prix des puces NVIDIA Hopper H100 sur le marché noir chinois, une méthode audacieuse a émergé : la location de puissance de calcul. Cette stratégie permet aux acteurs locaux d'accéder temporairement à ces ressources précieuses sans les coûts exorbitants et les risques associés à l'achat direct. Le Wall Street Journal révèle que des courtiers internationaux jouent un rôle central dans cette nouvelle dynamique, proposant des services de location en échange de cryptomonnaies pour garantir l'anonymat des transactions.Derek Aw, un entrepreneur au parcours atypique, illustre bien cette évolution. Ancien spécialiste du minage de Bitcoin, Aw a perçu le potentiel du marché de la location de puissance de calcul IA. À Brisbane, loin des yeux de Washington, il a convaincu des investisseurs de financer la construction d'une « cathédrale du calcul » équipée des puces H100 de NVIDIA. Fort du succès de cette entreprise, Aw envisage maintenant d'intégrer la nouvelle architecture Blackwell de NVIDIA pour offrir à ses clients chinois les dernières innovations du secteur. Cette tendance de décentralisation s'étend au-delà de la Chine. Des géants technologiques tels que Microsoft et Google proposent également des services de location de serveurs basés sur les puces A100 et H100 de NVIDIA aux clients chinois, sans enfreindre les réglementations américaines actuelles. Dans ce jeu du chat et de la souris entre régulateurs et innovateurs, il semble que la course à l'IA ne connaisse ni limites, ni frontières.
  • Une puce pour détecter les cancers du cerveau ?

    02:35|
    Le glioblastome, une forme agressive de cancer du cerveau, se développe directement dans les cellules gliales, les cellules de soutien du système nerveux central. Sa détection rapide est cruciale, car les patients n'ont en moyenne que 12 à 18 mois de survie après le diagnostic. Mais une nouvelle avancée technologique pourrait changer la donne : une puce bioélectronique développée par des chercheurs de l’Université de Notre Dame, en Indiana. Cette innovation permet de détecter le glioblastome en moins d'une heure, un bond en avant significatif dans le traitement de cette tumeur redoutable. Les détails de cette recherche ont été publiés le 3 juin dans la revue *Communications Biology*.La biopuce utilise une technologie électrocinétique avancée pour détecter les biomarqueurs spécifiques du glioblastome, notamment les récepteurs du facteur de croissance épidermique (EGFR), qui sont souvent surexprimés dans ces cancers. Hsueh-Chia Chang, professeur à Notre Dame et auteur principal de l'étude, explique que la puce cible les vésicules extracellulaires, des nanoparticules sécrétées par les cellules. « Notre technologie exploite les caractéristiques uniques de ces nanoparticules pour détecter les biomarqueurs avec une précision accrue », précise-t-il.L'équipe a surmonté deux défis majeurs : différencier les EGFR actifs des inactifs et créer un capteur à la fois sensible et sélectif. Ils ont conçu un capteur électrocinétique miniature, de la taille d’une bille, capable de se lier efficacement aux vésicules extracellulaires dans le sang. Selon Satyajyoti Senapati, professeur en génie chimique et biomoléculaire, leur capteur permet une analyse directe du sang, sans nécessiter de traitement préalable, et minimise les interférences, ce qui améliore la performance du diagnostic. Bien que la puce ait été développée pour le glioblastome, ses applications potentielles sont étendues. Elle pourrait bientôt être adaptée pour détecter le cancer du pancréas, les maladies cardiovasculaires, la démence, et l'épilepsie. En outre, chaque test nécessite seulement 100 microlitres de sang et peut être réalisé en moins d'une heure. Le coût de fabrication de la puce est inférieur à 2 dollars, rendant cette technologie prometteuse pour une utilisation à grande échelle. ETUDE : https://www.nature.com/articles/s42003-024-06385-1
  • Plaud NotePin, l’appareil qui retranscrit toute votre vie ?

    02:00|
    Après avoir fait sensation sur TikTok avec son enregistreur vocal boosté à l'IA, la startup Plaud passe à la vitesse supérieure avec son dernier produit connecté : le NotePin. Ce wearable, qui rappelle l'AI Pin de Humane mais avec une approche plus simplifiée, est conçu pour vous accompagner tout au long de la journée. Sa mission : enregistrer, transcrire et synthétiser les moments clés de votre quotidien. Ce petit appareil, au design évoquant les premiers bracelets Fitbit, se porte aussi bien en pendentif, épinglé sur une chemise ou attaché au poignet, offrant ainsi une grande flexibilité.Le NotePin s’inscrit dans la tendance des objets connectés axés sur l'IA, en ciblant notamment les professionnels soucieux d'optimiser leur efficacité. Avec une autonomie de 20 heures en enregistrement continu, il pourrait capturer chaque instant de votre journée. Toutefois, Plaud a opté pour un déclenchement manuel de l’enregistrement, une décision visant à prévenir les abus liés à une surveillance constante. Cette fonctionnalité soulève néanmoins des questions éthiques, notamment concernant le consentement à l’enregistrement dans les espaces publics ou professionnels. Le débat sur la vie privée et la confidentialité n’est donc pas clos, surtout si de tels appareils venaient à se démocratiser.Le NotePin s’appuie sur l’expertise de Plaud en matière de transcription et de synthèse vocale, déjà éprouvée avec leur précédent produit, le Note. Ce dernier, salué pour ses performances en transcription et résumé automatiques, a déjà séduit un large public. Le NotePin est proposé à 169 dollars, avec une offre logicielle déclinée en deux versions : une gratuite avec des fonctionnalités basiques, et une version pro à 79 dollars par an, offrant des options avancées comme des modèles de résumés personnalisés et l’identification des interlocuteurs.
  • IA : un projet chinois open source révolutionnaire ?

    01:59|
    Les générateurs de vidéos à partir de simples commandes textuelles, comme VideoCrafter-2.0, Pika Labs ou Open-Sora, ont rapidement gagné en popularité grâce à leurs capacités impressionnantes. Cependant, un projet open source mené par des chercheurs de l'université Tsinghua et de Zhipu AI, en Chine, pourrait bien révolutionner le domaine de l'IA vidéo.Ce nouvel outil, nommé CogVideoX, permet de créer des vidéos de six secondes à partir d'invites textuelles. Bien que ses performances soient encore en deçà des solutions commerciales, avec une définition de 720×480 pixels à huit images par seconde et cinq milliards de paramètres, son caractère open source pourrait redistribuer les cartes. En effet, l'implication de la communauté mondiale des développeurs pourrait accélérer son amélioration et son adoption. Sur le plan technique, les chercheurs ont mis au point un autoencodeur variationnel 3D (VAE), capable de compresser efficacement les vidéos. À cela s'ajoute un « transformateur expert », qui permet d'interpréter plus finement les commandes textuelles pour générer des vidéos en adéquation avec les attentes des utilisateurs.Cependant, cette ouverture n'est pas sans risques. L'accès libre à CogVideoX pourrait faciliter la création de deepfakes et d'autres contenus trompeurs. Avec une telle technologie disponible en open source, il est difficile de prédire si elle sera principalement utilisée pour le meilleur ou pour le pire. Quoi qu'il en soit, il est clair que CogVideoX marque une étape significative dans l'évolution de l'IA vidéo, avec des implications potentielles tant positives que négatives.
  • L’informatique moléculaire : révolution du stockage de données ?

    01:57|
    Aux côtés de l'informatique classique et quantique, une autre innovation prometteuse émerge : l'informatique moléculaire. Cette branche de recherche explore différentes possibilités, dont l'ordinateur à ADN, qui vient de franchir une étape importante grâce à une équipe de chercheurs de l'Université d'État de Caroline du Nord, aux États-Unis. Dans un article publié dans *Nature Nanotechnology*, ces scientifiques présentent un système capable à la fois de stocker et de traiter des informations en utilisant de l'ADN.Leur approche repose sur des polymères dotés de structures appelées dendricolloïdes. Ces structures commencent à l'échelle microscopique et se ramifient pour créer un réseau de fibres nanoscopiques, offrant ainsi une vaste surface pour déposer de l'ADN. Ce système ultra-compact permettrait de stocker « les données de mille ordinateurs portables dans un dispositif de la taille de la gomme au bout d'un crayon », selon Albert Keung, co-auteur de l'étude.Les chercheurs ont ensuite réussi à lire les données stockées dans l'ADN sans l'endommager, grâce au séquençage par nanopores. « Nous pouvons également effacer et réécrire des segments spécifiques d'ADN sur la même surface, de la même manière qu'on modifie un disque dur », explique Kevin Lin, un autre co-auteur de l'article. Ce système, comparable à des microcircuits, est même capable de réaliser des opérations de calcul en utilisant des enzymes, et a notamment résolu des problèmes basiques d'échecs et de sudoku.En plus de ses capacités de calcul, ce matériau offre une incroyable longévité pour la conservation de l'ADN. Selon les chercheurs, les données ainsi stockées pourraient être préservées pendant plusieurs milliers d'années, ouvrant la voie à des avancées majeures dans le stockage de données à long terme.Article : https://news.ncsu.edu/2024/08/functional-dna-computing/