↩ Accueil

Vue normale

index.feed.received.today — 3 avril 20257.1.1 🖥️ Sites principaux

Bon Plan : Cat Quest II offert par Epic Games

3 avril 2025 à 17:19

Le store d'Epic Games vous offre le jeu Cat Quest II, vous avez jusqu'au 10 avril, 17 heures, pour l'ajouter ici. Un RPG d'action en open-world qui a pour cadre un royaume imaginaire de chats et de chiens. Dans Cat Quest II, vous pouvez jouer seul ou à deux. Accomplissez les quêtes de ce monde magique, terrassez des monstres et récoltez du butin ! […]

Lire la suite

Anthropic lance son plan d'invasion des collèges et universités par son chatbot IA Claude, alors que les étudiants qui utilisent l'IA comme béquille n'apprennent rien, d'après Ethan Mollick

3 avril 2025 à 17:17
Anthropic lance son plan d'invasion des collèges et universités par son chatbot IA Claude, alors que les étudiants qui utilisent l'IA comme béquille n'apprennent rien, d'après Ethan Mollick

Anthropic, la société d'IA à l'origine du modèle de langage large Claude, a annoncé le lancement de Claude for Education, une version de son chatbot conçue pour répondre aux besoins des établissements d'enseignement supérieur. Cette version est destinée à aider les universités à intégrer l'IA dans l'enseignement,...

Legion Tower 5i Gen 10, Lenovo propose un Core Ultra i9 HX et une RTX 5060 (Ti) !

Legion Tower 5i Gen 10Lenovo a récemment listé un nouveau PC de bureau gaming, le Legion Tower 5i Gen 10 (Intel), sur son site officiel. Ce modèle repose sur un matériel inhabituel, notamment un processeur mobile réaffecté à une plateforme desktop, une approche connue sous le nom de Mobile on Desktop (MoDT). Un processeur mobile haut de gamme sur …

Cet article Legion Tower 5i Gen 10, Lenovo propose un Core Ultra i9 HX et une RTX 5060 (Ti) ! a été publié en premier par GinjFo.

Les crawlers des IA deviennent un sérieux problème pour le web, même pour Wikimédia

DDoS généré pour IA
Les crawlers des IA deviennent un sérieux problème pour le web, même pour Wikimédia

Pour entrainer et tenir à jour leurs intelligences artificielles, les crawlers des entreprises d’IA parcourent le web en permanence et sont suspectés de ne pas respecter les fameux robots.txt censés permettre leur blocage. Leur activité va jusqu’à mettre en péril des sites web de projets de logiciels libres ou toucher fortement les activités de Wikimédia.

Les entreprises qui ont mis en place des IA génératives comme OpenAI, Meta, Anthropic, Mistral ou encore Amazon, Google et Microsoft ont besoin d’indexer des contenus sur le web en permanence pour entrainer leurs grands modèles de langage (LLM), récupérer les nouvelles informations afin que leurs outils soient capables de répondre aux demandes de leurs utilisateurs.

Un trafic difficile à gérer, même pour la fondation Wikimédia

Mais en venant en permanence sur les sites web, ils ajoutent du trafic important à leur bande passante, au point de saturer certains. La fondation Wikimédia a publié un billet pour expliquer à quel point ces robots ont un impact sur ses projets : « Notre infrastructure est conçue pour supporter des pics soudains de trafic d’origine humaine lors d’événements très intéressants, mais le volume de trafic généré par les robots scrapeurs est sans précédent et présente des risques et des coûts croissants ».

En effet, ces entreprises récupèrent ces contenus à l’aide de « crawlers », des robots d’indexation, ou plutôt ici de récupération de données. OpenAI a officiellement donné le nom de son robot, GPTBot, en aout 2023, suscitant immédiatement la réaction de RSF qui a rapidement invité « tous les médias à configurer leurs sites pour éviter qu’OpenAI ne récupère leur contenu gratuitement ». C’est ce qu’ont fait beaucoup de sites web.

Un blocage pas si efficace

Pour cela, il « suffit » de lister dans le fichier robots.txt de son site les robots dont on ne veut pas. Mais, comme l’ont démontré récemment des chercheuses, certains robots récupèrent des informations de sites qui, pourtant, les ont ajoutés dans leurs listes. De plus, l’outil d’IA générative de Microsoft, Copilot, utilise BingBot, le robot d’indexation du moteur de recherche de l’entreprise. Un site qui voudrait bloquer l’IA de Microsoft ne serait plus indexé dans le moteur de recherche Bing.

Et, comme on l’a vu récemment, certains sites peuvent être visités 2 millions de fois par un bot en un trimestre. Il est déjà difficile pour des infrastructures comme celles de la Fondation Wikimédia de faire face à cet afflux « artificiel » pour gérer sa bande passante, mais ça l’est encore plus pour des projets qui ont moins de moyens.

Certains expriment leur ras-le-bol

Plusieurs responsables de projets de logiciels libres se sont plaints du problème, expliquait récemment ArsTechnica. Le développeur Xe Iaso a, par exemple, exprimé son ras-le-bol en janvier face au crawler d’Amazon : « À la personne qui gère AmazonBot, veuillez ajouter git.xeserv.us à votre liste de domaines bloqués. Si vous connaissez quelqu’un chez Amazon, merci de lui transmettre ce message et de lui demander de le transmettre à l’équipe d’AmazonBot » alors qu’il avait radicalement bloqué tous les robots dans son fichier robots.txt.

TheLibre.News a aussi recensé plusieurs infrastructures de logiciels libres touchés par ce problème. Le GitLab des développeurs de KDE a, par exemple, été touché par des crawlers ayant des IP détenues par Alibaba, ce qui l’a rendu temporairement inaccessible. L’un des administrateurs systèmes du projet Pagure de Fedora a, lui aussi, constaté un afflux massif de robots de récupération de données venant du Brésil. Il explique avoir décidé de bloquer temporairement toutes les IP brésiliennes pour en venir à bout tout en sachant bien que ce n’était pas une solution de long terme.

Gergely Orosz, qui publie la newsletter The Pragmatic Engineer, explique sur LinkedIn que le site d’un de ses projets personnels qui déclinait a reçu récemment un trafic important « lorsque le crawler AI de Meta et d’autres bots comme Imagesiftbot ont commencé à crawler le site sans réfléchir : ça a poussé le trafic à plus de 700Go par mois » alors qu’il était aux alentours de 100Go par mois un peu avant.

« Le site est hébergé sur Render où 500Go/mois sont inclus, au-delà c’est 30 $ pour 100Go. Ce mois-ci, je paie donc 90 $ pour l’entrainement de ces LLM », commente-t-il. Et lui aussi pointe que « l’ironie est que les robots – y compris Meta ! – ignorent manifestement le fichier robots.txt du site qui leur dit de « s’il vous plait, restez à l’écart » ».

Drew DeVault, le fondateur de la plateforme d’outils open source Source Hut, a publié un billet de blog le 17 mars dernier demandant aux entreprises d’IA génératives d’ « arrêter d’externaliser [leur] coûts directement sur [lui] ». « Au lieu de travailler sur nos priorités à SourceHut, j’ai passé entre 20 et 100 % de mon temps à atténuer les crawlers LLM hyper-agressifs », s’y lamente-t-il. Il explique que Source Hut subit des « dizaines de brèves pannes par semaine » et qu’il doit chercher tous les jours de nouvelles solutions pour ne pas voir la situation empirer. Le même jour, son entreprise expliquait que des crawlers de LLM continuaient à provoquer un DDoS sur SourceHut.

Des solutions pour piéger les crawlers d’IA

Elle expliquait avoir décidé de déployer Anubis pour essayer de bloquer les bots des entreprises d’IA. « Ce logiciel présente à certains utilisateurs un défi de preuve de travail qui est résolu par le navigateur de l’utilisateur à l’aide de JavaScript », explique SourceHut. C’est en fait une solution qu’a développé Xe Iaso après avoir publié son raz-le-bol.

D’autres solutions commencent à être développées, notamment en essayant de piéger les IA dans un labyrinthe de liens. Nepenthes, par exemple. Sa documentation explique que le logiciel « fonctionne en générant des séquences infinies de pages, chacune contenant des dizaines de liens, qui retournent simplement dans un piège ». Nepenthes ajoute des petits détails comme un délai ou une fausse apparence de fichiers statiques pour tromper le crawler.

De son côté, Cloudflare a aussi pensé à une solution de labyrinthe, explique-t-elle dans un billet de blog. Celle-ci « utilise du contenu généré par l’IA pour ralentir, embrouiller et gaspiller les ressources des AI Crawlers et d’autres robots qui ne respectent pas les directives « no crawl » ». L’entreprise, connue pour vendre des solutions pour augmenter la sécurité et les performances des sites internet, propose pour le moment à tous ses utilisateurs la possibilité d’activer gratuitement cette fonctionnalité.

Des serveurs d’IA au Vietnam équipés de GPU GeForce RTX 5090 malgré les pénuries

Des Serveurs Dia Au Vietnam Equipes De Gpu Geforce Rtx.png
Un site de ventes vietnamien propose des serveurs d’IA équipés de RTX 5090 pour tirer parti de leur capacité mémoire accrue. Des machines sont construites avec des configurations variées, illustrant une tendance marquée dans le secteur. Nguyencongpc présente des PC Serveurs d’IA avec jusqu’à Sept GPU RTX 5090 La GeForce RTX 5090 a été lancée […]

« BAISSEZ LES PRIX » : Nintendo harcelé par ses fans après l’annonce de la Switch 2

De nombreux internautes se plaignent du prix de la Switch 2 et de la future grille tarifaire qui se prépare pour les jeux vidéo. Cette colère s'est matérialisée avec fracas dans un direct organisé par Nintendo : de nombreux fans ont pris d'assaut les commentaires en réclamant une baisse des prix.

« BAISSEZ LE PRIX » : le Nintendo Treehouse de la Switch 2 se transforme en manifestation virtuelle

Alors que les présentateurs de Nintendo of America vantaient avec enthousiasme les mérites de la nouvelle console et de Mario Kart World sur YouTube et Twitch, le chat s'est métamorphosé en manifestation virtuelle.
 [Lire la suite]

Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).

Patch notes complets de Monster Hunter Wilds 1.010.00.00 : toutes les nouveautés à découvrir !

Monster Hunter Wilds Nouveau Gameplay 4k Et Performances Ameliorees.jpg
Les notes de mise à jour complètes de Monster Hunter Wilds version 1.010.00.00 ont été dévoilées, annonçant le nouveau contenu et les ajustements qui seront disponibles dans quelques heures. Retrouvailles avec des monstres emblématiques Le retour du monstre emblématique Mizutsune, ainsi que sa déclinaison Tempérée, a été confirmé. Les chasseurs pourront également s’attendre à l’ajout […]

Sécurité, chiffrement, souveraineté : pour Microsoft, "le plus gros défi en France, c’est la pénurie de talents"

3 avril 2025 à 17:30
Cette semaine, Clubic couvre les 50 ans de Microsoft. La multinationale s’est transformée au fil des décennies. Elle a su faire face à certains concurrents, mais elle a également dû s'incliner face à d’autres. Elle a su répondre aux attentes des consommateurs et des professionnels. Mais pas toujours. Et s’il y a un secteur sur lequel Microsoft n’a certainement pas droit de faillir, c’est celui de la sécurité informatique.

AirPods Max : Apple débloque enfin l’audio lossless après une mise à jour défectueuse retirée en urgence

Après un faux départ, les AirPods Max s’offrent une mise à jour qui promet de faire vibrer les mélomanes. Mais gare à la connexion USB-C, sans laquelle le son lossless reste un mirage…
 [Lire la suite]

Utilisez-vous Google News (Actualités en France) ? Vous pouvez suivre vos médias favoris. Suivez Frandroid sur Google News (et Numerama).

Find My Device se prépare à devenir encore plus précis grâce à cette nouvelle fonctionnalité

Vous perdez souvent vos affaires ? Bonne nouvelle : Google travaille sur une mise à jour de son application Find My Device pour rendre leur localisation encore plus facile.
 [Lire la suite]

Téléchargez notre application Android et iOS ! Vous pourrez y lire nos articles, dossiers, et regarder nos dernières vidéos YouTube.

Actualité : Avec Thundermail, Mozilla veut marcher sur les pieds de Gmail

Mozilla, surtout connu pour son navigateur Firefox, ne compte définitivement pas abandonner son client email Thunderbird. Après avoir proposé une sérieuse refonte de l'application, et surtout une version Android attendue depuis plusieurs années, la firme vient de lever le voile sur quelque chose d'encore plus ambitieux, baptisés Thundermail et Thunde...

AMD Radeon RX 9070 GRE : des rumeurs sur son lancement imminent

Radeon graphics card sits in a black PC.
La série Radeon RX 9070 a apporté un nouveau souffle à AMD sur le marché des cartes graphiques. Avec la prochaine sortie des modèles RX 9060, AMD pourrait continuer sur cette lancée. Cependant, des informations font état d’une nouvelle carte graphique qui pourrait rejoindre cette gamme, désignée sous le nom de Radeon RX 9070 GRE […]

Le Galaxy Ring 2 de Samsung pourrait arriver en 2025 avec une batterie révolutionnaire solide

Le Galaxy Ring 2 de Samsung pourrait arriver en 2025 avec une batterie révolutionnaire solide
Samsung prévoit de lancer le Galaxy Ring 2, une avancée majeure en matière de technologie de batterie. Ce dispositif pourrait inaugurer l’utilisation de batteries tout-solide, promettant une meilleure densité énergétique, mais des défis en matière de coût pourraient limiter son attrait dans un marché concurrentiel. Samsung se prépare à dévoiler le Galaxy Ring 2 lors […]

Nvidia GeForce Now en avril 2025 : Voici les 20 jeux qui arrivent sur le service, et il y a la prochaine pépite française dans le lot !

3 avril 2025 à 16:59

À chaque début de mois, Nvidia dévoile la liste des jeux devant arrivant sur son service de cloud gaming, GeForce Now. Le service inclut autant des jeux sorti il y a plusieurs mois ou années que d'autres Day One, à l'instar de Clair Obscure : Expedition 33.
 [Lire la suite]

Chaque matin, WhatsApp s’anime avec les dernières nouvelles tech. Rejoignez notre canal Frandroid pour ne rien manquer !

💾

Actualité : Surprise, une nouvelle série Star Wars prometteuse arrive bientôt sur Disney+

Chaque année, le 4 mai est une date phare pour tous les fans de la galaxie lointaine, très lointaine de George Lucas : c'est le Star Wars Day ! Pourquoi le 4 mai ? C'est une plaisanterie sur la fameuse phrase "May the Force (May the Fourth) be with You" ("Que la Force soit avec vous" en française).Et pour célébrer l'édition 2025 de cet événement, la...

Après la sortie des Poco F7 Pro et Ultra, c’est moitié prix pour le Xiaomi Poco F6 (512 Go) doté du Snapdragon 8s Gen 3

3 avril 2025 à 16:49

Le récent lancement des Poco F7 Pro et Ultra permet aux anciens modèles de la gamme de sacrifier leur prix. C'est actuellement le cas du Xiaomi Poco F6, un smartphone plutôt destiné aux gamers sur mobile avec un petit budget. Normalement à 503 euros dans sa version 512 Go sur le site officiel, on le trouve aujourd'hui à seulement 261 euros sur AliExpress.
 [Lire la suite]

Actualité : iPhone : de nouveaux boutons tactiles toujours envisagés par Apple

Après le bouton Action sur les iPhone 15 Pro ou le bouton de Commande de la caméra sur les iPhone 16, Apple aurait d’autres ambitions pour ses futurs iPhone. Une récente information du divulgâcheur Instant Digital a en effet relancé la rumeur de boutons tactiles à retour haptique en cours de développement.De nouveaux boutons tactiles à retour haptiqu...

La mémoire DDR5 va devenir nettement plus chère : hausse des prix chez Samsung

Cxmt Nouveau Developpement De Technologie Ddr5 En Concurrence Avec.jpg
La situation de l’industrie DRAM semble devenir préoccupante alors que Samsung prévoit d’augmenter ses prix à l’échelle mondiale. Cela intervient dans un climat d’incertitude qui ne favorise pas les consommateurs. Augmentation Imminente des Prix de la DRAM et de la NAND La tendance actuelle du marché n’est pas au bénéfice des utilisateurs, car des entreprises […]

Actualité : Retro Tech  : Game Boy, iPod et Mega Drive s’affichent désormais sur Back Market

Qui a dit qu’un appareil reconditionné devait forcément paraître neuf ? S’inspirant de son récent slogan publicitaire, Back Market liste depuis quelques semaines maintenant des tas d’objets « flambants vieux » issus des années 90 et 2000.La rubrique "Retro Tech" arrivée le 5 mars dernier propose autant des vieilles Game Boy grises à pile que des comp...

La mauvaise habitude de Star Wars revient, et elle va encore nécessiter des explications

Tales of the Underworld

Il y a une mauvaise habitude dans Star Wars : le retour à la vie de personnages censés être morts. La série d'animation The Bad Batch, dans sa saison 3, a recommencé. Et il s'avère que Lucasfilm, le studio de production, va sans doute donner une explication rétroactive à cette nouvelle résurrection dans une nouvelle série qui arrive début mai : Tales of the Underworld.

❌