↩ Accueil

Vue normale

GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA

Par :Wael.K
3 février 2026 à 10:13

La start-up chinoise Zhipu AI présente GLM-OCR, un modèle OCR multimodal ouvert qui revendique un score de 94,6 sur OmniDocBench V1.5 avec seulement 0,9 milliard de paramètres. Compatible vLLM, SGLang et Ollama, il vise des déploiements à latence basse, y compris en périphérie, tout en gardant des résultats SOTA sur la reconnaissance de formules, de tableaux et l’extraction d’informations.

Ce que fait GLM-OCR et comment

GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA

Le modèle adopte une architecture encodeur-décodeur héritée de GLM-V, avec un encodeur visuel CogViT (environ 400 M de paramètres), une couche de connexion légère utilisant SwiGLU et un downsampling x4, puis un décodeur GLM-0.5B. L’entraînement combine pré-entraînement de type CLIP sur des milliards de paires image-texte, introduction de la perte MTP (multi tokens) pour densifier le signal supervisé et un cycle de RL sur tâches réelles afin d’améliorer robustesse et généralisation sur documents complexes.

GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA

Zhipu met en avant une segmentation en deux temps « analyse de mise en page → reconnaissance parallèle », avec un module de layout basé sur PP-DocLayout-V3. Côté cas d’usage, les démonstrations couvrent l’écriture manuscrite, les tableaux complexes à en-têtes multiples ou cellules fusionnées avec sortie directe en HTML, les tampons/estampilles et la lecture de code source, ainsi que l’extraction structurée vers JSON pour cartes, factures ou documents logistiques.

GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA

Performances, débit et coûts

En test interne, le débit atteint 1,86 page/s sur PDF et 0,67 image/s sur fichiers image, dans des conditions identiques et en export Markdown. L’éditeur annonce une tarification API symétrique entrée/sortie de 0,2 ¥ par million de tokens, soit 0,026 € environ, ce qui permettrait de traiter à peu près 2 000 pages A4 scannées ou 200 PDF de 10 pages pour 1 ¥ (environ 0,13 €), avec un coût présenté comme dix fois inférieur à des OCR classiques.

GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA
GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA
GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA
GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA
GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA
GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA
GLM-OCR : un OCR multimodal 0,9B compatible Ollama, rapide et SOTA

Le modèle est publié avec un SDK et une toolchain d’inférence, installation simple et invocation en une commande, et peut s’intégrer dans des pipelines RAG grâce à des sorties normalisées. Les cibles de déploiement incluent les serveurs à forte concurrence et les mini PC/edge grâce au faible encombrement mémoire et au nombre de paramètres réduit.

Disponibilité et liens

Code et poids sont disponibles sur GitHub et Hugging Face, avec une API via la plateforme Zhipu. Une démo en ligne est accessible. Zhipu prévoit d’étendre la famille à d’autres tailles et vers le multilingue étendu ainsi que la vidéo.

Pour un marché saturé par des OCR lourds ou dépendants d’infrastructures coûteuses, l’équation 0,9B + pipeline soigné + SDK prêt à l’emploi est stratégique. Si les chiffres annoncés sur layout complexe et tables HTML se confirment en production, les éditeurs de solutions documentaires et les intégrateurs RAG ont un candidat sérieux pour réduire la latence, le coût et la dépendance aux GPU haut de gamme, sans sacrifier la précision sur des cas réputés difficiles comme les formules et les tampons.

Source : ITHome

ROG Falchion Ace 75 HE : nouveau clavier eSport 75 % désormais disponible

3 février 2026 à 10:02

Republic of Gamers (ROG) annonce la disponibilité immédiate du ROG Falchion Ace 75 HE. Le nouveau clavier mécanique combine une disposition 75 % d’espace avec un polling rate de 8000 Hz, ainsi que des switchess magnétiques avec des points d’activation personnalisables, le tout dans un boîtier robuste et ergonomique.

ROG Falchion Ace 75 HE deux couleurs

Le nouveau capteur Hall ROG garantit une précision exceptionnelle et minimise les interférences. Avec un taux de polling de 8000 Hz, chaque frappe est enregistrée en seulement 0,125 ms, ce qui la rend jusqu’à huit fois plus rapide que les appareils comparables.

ROG Falchion Ace 75 HE nnoir face

Un cadran intégré permet d’ajuster finement le point de déclenchement et une sensibilité rapide, tandis que le pavé tactile interactif permet un contrôle pratique pour les paramètres médias et système. Un amorti à six couches améliore l’acoustique des frappes de touche, et des touches durables ROG Doubleshot PBT avec étui protecteur rendent le clavier prêt à voyager.

ROG Falchion Ace 75 HE arrière

Principaux atouts du ROG Falchion Ace 75 HE :

  • Switches ROG HFX V2 échangeables à chaud : Point de déclenchement personnalisable de 0,1 mm à 3,5 mm,
  • Polling rate 8000 Hz : Offre un temps de réponse de 0,125 ms, ce qui le rend jusqu’à 8 fois plus rapide que des claviers comparables,
  • Conçus pour les compétitions : Rapid Trigger réglable et mode Speed Tap.

Disponibilité et prix

Le ROG Falchion Ace 75 HE est désormais disponible en Allemagne, en Autriche et en Suisse à un prix de détail recommandé de 239,90 EUR / CHF TVA incluse chez les détaillants spécialisés et en ligne ainsi que dans la boutique en ligne ASUS (DE/AT & CH). La version blanche suivra au deuxième trimestre.

ROG Falchion Ace 75 HE dos

Caractéristiques complètes :

ConnectivitéFilaire
SwitchesMagnétique ROG HFX V2
TouchesPBT Keycaps
Disposition75 % (83/84 touches)
ÉclairageLED RGB par touche
Bouton multifonction & panneau tactile4 modes : volume, contrôle des médias, luminosité, fonction de défilement (réglable librement)
Anti-ghostingN-Key Rollover
Polling Rate8000 Hz
MacrosTous les boutons sont programmables avec enregistrement de macros à la volée
Type de câbleCâble amovible USB-A à USB-C tressé
Systèmes d’exploitation pris en chargeWindows 11
Stockage embarqué5 profils personnalisables + 1 profil standard
LogicielsGear Link
Dimensions320 × 145 × 35 mm
Poids870 g (sans câble)
Accessoires1× ROG Falchion Ace 75 HE
1× housse de transport
1× câble USB-C vers A
1× extracteur de keycaps ROG
1× keycap Ctrl
1× carte de garantie
1× guide de démarrage rapide
1× autocollant ROG

Nintendo Switch 2 dépasse 17,37 M au 31 décembre 2025, 7,01 M sur le trimestre

Par :Wael.K
3 février 2026 à 10:01

Première année solide pour la nouvelle machine de Nintendo, avec un volume proche de la première génération et une trajectoire annuelle stabilisée. Les chiffres consolidés confirment un démarrage soutenu sur neuf mois.

Nintendo Switch 2 : un premier trimestre des fêtes à 7,01 millions

Nintendo publie 7,01 millions d’unités Switch 2 écoulées entre octobre et décembre 2025. Le cumul atteint 17,37 millions sur la période avril à décembre 2025, soit les neuf premiers mois commerciaux.

Capture d'écran des ventes Nintendo Switch 2 avec chiffres sur fond blanc

Ce volume trimestriel reste légèrement derrière la première Switch, créditée de 7,23 millions sur octobre-décembre 2017, soit environ 220 000 unités d’écart. En revanche, l’agrégat au 31 décembre est supérieur à la précédente génération, qui pointait à 14,86 millions au 31 décembre 2017.

L’exercice fiscal se poursuit avec une prévision inchangée de 19,0 millions d’unités Switch 2 d’ici fin mars 2026. Switch 2 a été lancée le 5 juin 2025 ; le trimestre clos en décembre couvre donc son premier pic saisonnier, traditionnellement le plus porteur pour le jeu vidéo.

Graphique comparatif des ventes de matériel et logiciel Nintendo Switch 2 avec barres colorées

Comparatif générationnel et portée marché

Face à la Switch de 2017, Switch 2 signe un « holidays » un cran en dessous, mais un cumul supérieur sur neuf mois, signal d’un pipeline d’approvisionnement et d’une demande mieux étalés. La cible annuelle de 19,0 millions suppose un dernier trimestre fiscal d’environ 1,63 million d’unités, un palier accessible hors pics.

Si la cadence se maintient, Nintendo verrouille un parc installé conséquent dès l’exercice de lancement, favorable aux sorties first-party et aux portages tiers. L’écart contenu avec la Switch 2017 sur le trimestre des fêtes et l’avance sur le cumul renforcent la visibilité commerciale à court terme.

Source : VideoCardz

ATK Yogo 75 : clavier low-profile 75 % en POM, Kickstarter prolongé et lancement proche

Par :Wael.K
3 février 2026 à 09:41

Un 75 % low-profile en POM avec 2 500 h d’autonomie, c’est rare. ATK pousse son Yogo 75 en fin de Kickstarter avant une mise en vente rapide.

Yogo 75 : design alu, POM low-profile et tri-mode

Le Yogo 75 adopte un châssis tout aluminium avec montage sur joints silicone. Format 75 %, tri-mode complet : Bluetooth, 2,4 GHz et USB-C. Batterie 5 000 mAh annoncée pour jusqu’à 2 500 heures, probablement sans le rétroéclairage RGB orienté au nord.

Montage présentant le clavier mécanique low-profile ATK Yogo 75 avec divers composants et fonctionnalités.

ATK a conçu avec Kailh de nouveaux switches low-profile tout POM, proposés en linéaire silencieux ou linéaire classique. Keycaps PBT dye-sub de hauteur « universelle », profil proche des Iqunix Magi/MQ. Coloris prévus : noir, argent ou jaune crème.

Pro vs standard : écran pixel, encodeur et plaques

La version Pro ajoute un écran pixel sous cache dépoli et un encodeur rotatif. La standard utilise une plaque PC, quand la Pro passe en FR4. Les pieds détachables magnétiques permettent d’ajuster l’angle de frappe, à la différence du simple emboîtement chez Wooting 80HE.

Ecran lumineux du clavier ATK Yogo 75 montrant une flèche orange.

Les deux versions supportent le driver web d’ATK et l’app VIA pour le remapping et les macros. Le firmware maison pourrait expliquer l’autonomie élevée, mais il faudra vérifier l’étendue des fonctions avancées face à un QMK complet.

Kickstarter étendu, prix visé et disponibilité

La campagne Kickstarter est prolongée et l’ouverture sur la boutique ATK Gear est imminente. Le tarif attendu se situe entre 100 et 130 $ selon les ventes et la variante, soit environ 92 à 120 € à titre indicatif.

Diagramme expliquant le fonctionnement des touches Flowing Cloud en POM sur le clavier ATK Yogo 75.

Positionnement clair : un 75 % low-profile en alu, switches POM dédiés, options Pro utiles, et une autonomie hors-norme sur le papier. Si l’exécution logicielle confirme la compatibilité VIA sans compromis, ATK se place en alternative crédible aux claviers 75 % établis.

Diagramme du mécanisme des interrupteurs Deep Sea Silence du clavier ATK Yogo 75.
Connectique du clavier ATK Yogo 75, montrant Bluetooth, 2.4 GHz et USB-C.
Design des pieds magnétiques et compétences en aluminium CNC du clavier ATK Yogo 75.
Vue en gros plan des touches low-profile du clavier ATK Yogo 75.

Source : TechPowerUp

Grok dans les agences fédérales américaines : un moratoire réclamé pour raisons de sécurité

Par :Wael.K
3 février 2026 à 06:20

Un consortium d’ONG américaines presse la Maison-Blanche de suspendre immédiatement l’usage de Grok, le chatbot d’xAI, dans les agences fédérales, y compris au sein du département de la Défense. Dans une lettre ouverte relayée par TechCrunch, les signataires dénoncent des « défauts systémiques » et des risques non maîtrisés, pointant en particulier la capacité du modèle à générer et diffuser des images sexuellement explicites non consenties, y compris impliquant des mineurs, via la plateforme X appartenant au même groupe.

Les organisations Public Citizen, Center for AI and Digital Policy ou encore Consumer Federation of America reprochent à l’Office of Management and Budget (OMB) de ne pas avoir ordonné l’arrêt de Grok dans l’administration malgré les directives fédérales et l’arsenal réglementaire récent, dont une loi de retrait obligatoire de contenus illicites. Elles estiment que Grok ne répond pas aux exigences de sécurité des systèmes d’IA fixées par l’exécutif et qu’un système présentant des risques graves, prévisibles et insuffisamment contrôlés doit être mis hors service.

xAI dispose depuis septembre d’un accord avec la General Services Administration autorisant la vente de Grok aux agences fédérales de l’exécutif. Deux mois plus tôt, la société avait décroché, aux côtés d’Anthropic, Google et OpenAI, une tranche de contrat du Pentagone pouvant atteindre 200 millions de dollars. À la mi-janvier, alors que la polémique autour de contenus explicites explosait sur X, le secrétaire à la Défense Pete Hegseth indiquait que Grok serait connecté au réseau interne du Pentagone, aux côtés de Gemini de Google, pour traiter des documents classifiés et non classifiés, un choix jugé risqué pour la sécurité nationale par plusieurs experts.

Les signataires demandent aussi à l’OMB d’ouvrir une enquête formelle sur les failles de sécurité de Grok, de vérifier le respect des procédures d’audit, et de préciser si l’évaluation du modèle a été conduite au regard des directives présidentielles imposant des exigences de véracité et de neutralité, ainsi que des standards de gestion des risques de l’OMB. Public Citizen évoque des dérives récurrentes du modèle, parmi lesquelles des propos antisémites, sexistes, et la génération d’images sexualisées de femmes et d’enfants.

Depuis l’émergence du scandale en janvier, l’Indonésie, la Malaisie et les Philippines ont instauré puis levé des blocages d’accès à Grok. L’UE, le Royaume-Uni, la Corée du Sud et l’Inde ont lancé des investigations sur xAI et X autour de la protection des données et de la diffusion de contenus illicites.

Enjeux réglementaires et sécurité fédérale

Au cœur du dossier, la compatibilité de Grok avec les garde-fous fédéraux sur l’IA déployée en contexte sensible. L’OMB peut exiger la suspension d’outils jugés non conformes, ce qui exposerait xAI à une mise à l’écart temporaire des marchés publics, malgré les accords-cadres existants. Pour le Pentagone, la question dépasse la conformité procédurale et touche la résilience opérationnelle des systèmes traitant des flux classifiés et l’exposition potentielle à des attaques par contenus générés ou détournés.

Dans un marché déjà polarisé par les contraintes de sûreté, une suspension de Grok dans le périmètre fédéral renforcerait mécaniquement la position d’acteurs perçus comme plus matures en gouvernance des modèles et en filtrage de contenus. À l’inverse, si xAI apporte des garanties auditées sur la génération d’images et la modération à l’échelle de X, l’entreprise pourrait préserver ses accès et rétablir un minimum de confiance institutionnelle.

Source : ITHome

GOG admet l’usage d’IA pour une bannière et reconnaît un double échec qualité/réaction

Par :Wael.K
3 février 2026 à 02:13

GOG a confirmé sur son serveur Discord que la bannière incriminée était un WIP réalisé avec des outils d’IA, déjà admis plus tôt sur ses forums.

GOG reconnaît l’IA et un double échec opérationnel

GOG a confirmé sur son serveur Discord destiné aux Patrons que la bannière incriminée était un WIP réalisé avec des outils d’IA, déjà admis plus tôt sur ses forums. L’entreprise parle d’un échec à deux niveaux : contrôle qualité du visuel publié en page d’accueil et lenteur de réaction une fois l’erreur détectée.

Le représentant rappelle la taille réduite de l’équipe et la volonté d’expérimenter des technologies permettant de produire davantage avec moins de ressources, tout en reconnaissant la sensibilité du sujet au sein de la communauté. Il précise que certains tests réussissent, d’autres non, et que ce cas relève de la seconde catégorie.

Contexte et réaction communautaire

La controverse a éclaté après la mise en ligne de la bannière de soldes du Nouvel An. GOG insiste sur le caractère non destiné à la publication de cet asset et indique que la décision d’un membre de quitter le Discord Patrons relève d’un choix personnel lié au climat tendu.

La position affichée ne remet pas en cause les tests internes de l’IA générative dans les workflows, malgré la défiance exprimée en externe et au sein de l’industrie. Le message officiel vise à cadrer l’incident comme un problème de pipeline et de process plutôt qu’un revirement stratégique.

Pour un distributeur attaché à la préservation et au DRM-free, l’arbitrage entre cadence de production visuelle et acceptabilité communautaire devient un sujet de gouvernance produit : revoir la chaîne de validation et cloisonner les assets WIP s’impose s’ils veulent continuer à tester l’IA sans exposer des éléments non finalisés.

Source : TechPowerUp

Intel Xeon 600 : deux cartes mères GIGABYTE MW94-RP0 et MW54-HP0 pour stations de travail

Par :Wael.K
3 février 2026 à 02:13

GIGABYTE s’apprête à lancer deux plateformes conçues pour les stations d’ingénierie et l’IA, misant sur un PCIe 5.0 généralisé, une DDR5 plus rapide et des processeurs Xeon pouvant atteindre 86 cœurs.

Plateforme Intel Xeon 600 et W890

Bâtis autour des processeurs Intel Xeon 600 pour stations de travail, ces modèles tirent parti des P-cores Redwood Cove+ gravés en Intel 3, avec accélération IA et bande passante plateforme en hausse. Le chipset W890 apporte une connectivité étendue : PCIe 5.0 élargi et DDR5 accélérée, pour des charges en ingénierie, data science, création média et développement IA.

Giga Computing, filiale de GIGABYTE, ouvre la gamme avec les cartes mères MW94-RP0 et MW54-HP0, au format châssis traditionnel et orientées fiabilité entreprise.

MW94-RP0 : maximum de lanes et de GPU

Carte mère GIGABYTE MW94-RP0 en vue rapprochée

Conçue pour les Intel Xeon 690 & 670, la MW94-RP0 supporte jusqu’à 86 cœurs CPU, 8 canaux mémoire DDR5 dont MRDIMMs, et 128 lanes PCIe 5.0. Six slots d’extension Gen 5 x16 permettent des configurations GPU denses pour simulation scientifique et rendu 3D.

Côté stockage et I/O, la carte aligne deux connecteurs MCIO 8i et trois SlimSAS pour multiplier SSD et cartes d’extension. Le réseau intègre deux ports 10 Gb/s afin de réduire les temps de transfert de gros datasets et flux vidéo.

MW54-HP0 : Intel Xeon 600 plus accessible

Destinée aux configurations Xeon 630 ou 650, la MW54-HP0 reprend le socket LGA4710-2 de la MW94 mais se limite à 4 canaux mémoire et 80 lanes PCIe 5.0. Elle propose cinq slots Gen 5 x16 pour GPU et NIC rapides, trois M.2 Gen 4 et huit ports SATA.

Carte mère GIGABYTE MW64-HB0 en vue rapprochée

Elle vise un bon rendement perf/watt et conserve les fonctions RAS avec ECC, tout en profitant des accélérations IA (AMX avec FP16). Le réseau s’appuie sur deux ports 2,5 Gb/s, avec agrégation et redondance.

La combinaison PCIe 5.0 généreuse, mémoire DDR5 à large bande passante et options de connectivité modernes positionne ces cartes sur des postes de travail évolutifs, du GPU compute intensif aux workflows plus contenus mais critiques en fiabilité. L’arrivée des Xeon 600 en Intel 3 avec Redwood Cove+ et W890 rétablit un socle cohérent pour des stations IA/ingénierie haut de gamme, tout en offrant une rampe d’accès plus économique via la MW54-HP0.

Source : TechPowerUp

OpenAI Codex macOS : client natif multi-agents pour dev, face à Claude Code

Par :Wael.K
3 février 2026 à 00:20

OpenAI lance une application Codex native pour macOS, pensée pour le développement « agentisé » et clairement positionnée face à Claude Code et Cowork. Après un outillage lancé d’abord en CLI puis en interface web l’an dernier, l’éditeur propose un client desktop qui agrège les logiques de workflows par agents, la coordination multi-agents et l’exécution parallèle de tâches.

Un client macOS qui embrasse les workflows par agents

Codex pour macOS combine plusieurs agents capables d’orchestration, avec fusion des sorties et reprise de contexte. L’application autorise des tâches automatisées planifiées, exécutées en arrière-plan, dont les résultats sont mis en file d’attente pour consultation différée. Les profils d’interaction sont modulables selon la préférence de l’utilisateur, d’un style factuel à une approche plus empathique, pour adapter la granularité et le ton des échanges selon le type de mission.

Introducing the Codex app OpenAI mac os

OpenAI s’appuie ici sur GPT-5.2-Codex, son modèle code le plus puissant, lancé il y a moins de deux mois. Sam Altman insiste sur le fait que la barrière d’usage du modèle brut restait trop élevée et qu’un client plus souple gommera cette friction. L’objectif est limpide : capter les utilisateurs de Claude Code en misant sur l’intégration système et la vitesse d’exécution locale d’un client natif.

Des performances solides, mais des écarts ténus sur les benchmarks

Sur TerminalBench, GPT-5.2 pointe en tête au moment d’écrire ces lignes, mais Gemini 3 et Claude Opus affichent des scores d’agents très proches, dans la marge d’erreur. Même constat sur SWE-bench pour la correction de bugs réels, où GPT-5.2 ne creuse pas d’écart net. Les benchmarks peinent toutefois à capturer les bénéfices des workflows multi-agents et de l’UX, deux variables susceptibles de faire la différence au quotidien.

Côté productivité, OpenAI met en avant la capacité à prototyper des applications complexes en quelques heures, en partant de zéro, grâce à l’orchestration d’agents spécialisés. Les automatismes programmables et l’exécution en tâche de fond visent à couvrir les usages de veille, de build répétitif et de tests, sans monopoliser l’utilisateur.

Positionnement et conséquences pour l’écosystème

Le choix du macOS natif n’est pas anodin: il cible une base significative de développeurs front-end et mobile, friands d’outils intégrés. Si la parité fonctionnelle avec Claude Code sera scrutée, la bataille se jouera surtout sur la qualité de l’orchestration et la latence perçue. À court terme, l’arrivée de Codex sur desktop pourrait accélérer l’adoption de pipelines par agents en local, pousser les éditeurs concurrents à soigner l’intégration OS et, surtout, déplacer la comparaison des modèles vers la cohérence des workflows et la fiabilité des boucles d’itération plutôt que vers les seuls scores synthétiques.

Source : ITHome

❌