Mistral dévoile deux modèles de transcription multilingue, dont un en quasi-temps réel
L’IA générative aura grandement fait progresser les technologies de transcription. Si l’on parle souvent du Whisper d’OpenAI, Mistral a présenté aujourd’hui une famille de modèles pensés pour cet usage. L’un d’entre eux est spécifiquement pensé pour la transcription en temps réel.

La famille se compose de deux modèles. Le premier est Voxtral Mini Transcribe V2, que l’on nous présente comme à la pointe et prenant en charge le découpage selon les intervenants, le biais contextuel ainsi qu’un horodatage au niveau des mots. Il fonctionne avec 13 langues, à savoir l'anglais, le chinois, l'hindi, l'espagnol, l'arabe, le français, le portugais, le russe, l'allemand, le japonais, le coréen, l'italien et le néerlandais. Plutôt pensé pour transcrire de gros lots de fichiers à la fois, il peut traiter des enregistrements jusqu’à 3 heures en une requête.
De son côté, Voxtral Realtime a été conçu spécialement pour la transcription en direct avec une latence configurable à moins de 200 ms, ce qui permet de s’en servir en temps réel. Selon Mistral, il surpasse GPT-4o mini Transcribe et Gemini 2.5 Flash. Prenant lui aussi en charge 13 langues, il est disponible en open-weights sous licence Apache 2.0 et peut être essayé dans Mistral Studio ou via le chatbot Le Chat.
Voxtral Realtime fait 4 milliards de paramètres et est donc suffisamment petit pour tourner sur un téléphone ou un ordinateur en local. Selon Mistral, ces deux nouveaux modèles sont à la fois moins coûteux à exploiter et moins sujets aux erreurs que les alternatives concurrentes.
Voxtral Mini Transcribe V2 est disponible via une API à 0,003 $ la minute, tandis que la variante temps réel est annoncée à 0,006 $ la minute. Cette dernière est intéressante : le dernier modèle du genre de Google a une latence d’environ 2 secondes. NVIDIA propose aussi Parakeet, un modèle ASR très performant en anglais sur GPU davantage pensé pour le traitement à grande échelle que pour la transcription multilingue.









Si la puce M5 lancée sur le MacBook Pro 14 pouces d'entrée de gamme en octobre dernier conserve une méthode de fabrication traditionnelle sous la forme d'un SoC (System-on-a-Chip) produit en un seul bloc, les futures puces M5 Pro et M5 Max pourraient basculer sur la technologie SoIC de TSMC. SoIC...

Le taux de rafraîchissement du prochain modèle de Studio Display d'Apple pourrait ne pas monter à 120 Hz mais plafonner à 90 Hz, d'après une source du site MacRumors, et cela pour des considérations de bande passante afin que le Studio Display puisse gérer des périphériques en plus de sa...

Apple a hier soir lancé les versions RC d'iOS 26.3 et macOS 26.3. En l'attente des nouveaux MacBook Pro haut de gamme que les rumeurs attendaient avec macOS 26.3, Nicolás Alvarez s'est immédiatement lancé à la recherche de nouvelles références de puces... et en a trouvé deux qui sont plutôt...


Apple a ce soir distribué les versions Release Candidate de iOS 26.3, macOS 26.3, watchOS 26.3, tvOS26.3 et visionOS 26.3. C'est l'ultime étape avant la sortie : si aucun pépin majeur n'est détecté dans les prochains jours, ce sont ces versions qui seront déployées auprès du grand public,...


