Apple utilise des puces Amazon pour préentraîner Apple Intelligence
C'est le français Benoit Dupin, un des responsables d'Apple dans le domaine de l'intelligence artificielle, qui l'a annoncé dans une conférence Amazon dédiée à AWS (son service de cloud) : Apple emploie les puces Trainium et Trainium2 pour préentraîner ses services liés à l'intelligence artificielle.
Le fait d'utiliser les services d'Amazon n'est pas une nouveauté : les puces ARM Graviton animent de nombreux services Apple (Apple Music, Plans, Siri, etc.). Mais passer par les puces spécialisées Trainium est plus étonnant : une bonne partie du marché repose sur les cartes de Nvidia et Apple avait déjà annoncé employer des puces Google pour l'entraînement initial de ses modèles.
Apple a utilisé des puces conçues par Google pour entraîner les modèles destinés à Apple Intelligence
Les puces Trainium2, qui sont disponibles à la location pour les clients AWS, peuvent être vues comme de (très) gros NPU, les unités dédiées à l'IA présentes dans les systèmes sur puce. La différence par rapport à un NPU vient évidemment de la puissance, même si les valeurs communiquées ne sont pas nécessairement comparables. Le point le plus important des puces dédiées comme les Trainium2 vient de la mémoire : Amazon a choisi d'intégrer 96 Go de mémoire HBM avec une bande passante de 2,9 To/s, des valeurs très élevées. Selon Dupin, les cartes Trainium2 permettent un gain de 50 % en efficacité.
Rappelons une chose : Apple utilise des puces venues de différents fabricants pour le préentraînement, une des premières phases de la mise en place des intelligences artificielles génératives, mais la partie qui traite les données de ses clients, elle, repose sur des serveurs Apple équipés de puces Apple M2 Ultra.
Private Cloud Compute : comment Apple veut faire rimer « intelligence » et « confidentialité »