Comment Apple s’est pris les pieds dans le tapis avec son nouveau Siri
Apple s’est tiré une balle dans le pied en annonçant son nouveau Siri, censé pouvoir interagir avec ce qui est affiché à l’écran de l’iPhone en plus de pouvoir piocher dans les données personnelles de l’utilisateur. Cette refonte devait être l’argument phare d’Apple Intelligence, mais a été repoussée aux calendes grecques. Comment en est-on arrivé là ? Selon les sources de The Information, les déboires de Cupertino à ce niveau viendraient d’un manque de données à moissonner pour ses modèles, ce qui s’explique par sa politique très carrée sur la confidentialité des données. Mais les employés d’Apple interrogés évoquent également des conflits humains liés aux différentes manières de gérer les équipes.

En 2018, Apple débauchait John Giannandrea, un ancien de Google mis à la tête de l’équipe d’IA et qui a été immédiatement intéressé par Siri. À l’époque, les ingénieurs qui s’occupaient de l’assistant se sentaient délaissés par rapport à l’équipe logiciel de Craig Federighi, perçue au sein de l’entreprise comme très efficace. En face, les personnes interrogées décrivent le responsable des opérations de Siri Robby Walker comme quelqu’un ne souhaitant pas prendre de risque : l’un de ses plus gros projets récents est l’abandon du « Hey » de « Hey Siri », qui a passé deux ans en cuisine. Il a visiblement eu du mal a discerner l’intérêt de l’IA. L'année dernière encore, il aurait repoussé l’idée d’intégrer un LLM à Siri dans le but de lui donner une plus grande sensibilité émotionnelle face aux utilisateurs en détresse.
Bien qu’on lui ait soumis l’idée, John Giannandrea aurait refusé de changer la direction de Siri. Il a également manqué de vision concernant l’IA : il estimait que l’apprentissage automatique ne pouvait conduire qu’à des améliorations progressives. Il s’est aussi montré méfiant vis-à-vis du ChatGPT d’OpenAI, ne voyant pas la valeur ajoutée du service pour les utilisateurs.
Les relations entre l’équipe IA/Siri et celle de Federighi se seraient tendues au fil du temps. Giannandrea aurait la réputation d’être un manager plutôt décontracté et à l’écoute, là où Federighi serait connu pour poser des questions et être particulièrement exigeant. Des tensions auraient émergé sur certains points, comme le fait que les employés sous la direction de Giannandrea disposaient de plannings moins remplis, de meilleures payes et de promotions plus rapides.
Bien que les troupes de Craig Federighi ne soient pas focalisées sur l’aspect IA, le vice-président a tout de même mis sur pied une équipe d’une centaine d’ingénieurs spécialisés, surnommée Intelligent Systems. Gérée par Sebastien Marineau-Mes, celle-ci aurait construit ses propres modèles accompagnés de démos pour contrôler des apps par la voix… parfois sans faire appel à l’équipe Siri. Une source de tension supplémentaire qui n’a pas été aidée par le développement du Vision Pro.
Selon les témoins interrogées, le chef du casque Mike Rockwell avait de grandes ambitions pour Siri sur son produit. Il voulait par exemple que l’utilisateur puisse redimensionner une fenêtre par la voix, ou que plusieurs personnes puissent papoter avec l’assistant en même temps. Face à la difficulté de répondre à la commande, l’équipe Siri serait passée à côté d’un bon nombre d’idées. Les relations entre Mike Rockwell et John Giannandrea se seraient donc tendues, tout comme avec celles de Sebastien Marineau-Mes, dont les équipes ont tenté de collaborer sur un projet de commandes vocales pour le Vision Pro.
L’arrivée de ChatGPT fin 2022 a ravivé les tensions. John Giannandrea, pourtant en charge de la question de l’IA, ne se serait pas jeté sur la nouveauté, contrairement aux équipes de Federighi ayant rapidement mis sur pieds des démos et autres concepts tournant à l’aide des modèles d’OpenAI. Cependant, la direction d’Apple a imposé l’utilisation de ses propres moteurs, dont la création revenait aux troupes de Giannandrea. Entre 2023 et 2024, les résultats auraient été bien en deçà de ce que proposait alors OpenAI.

Est arrivée la WWDC 2024 et la présentation du nouveau Siri… qui n’était qu’un montage. L’équipe en charge de Siri l’aurait découvert avec surprise, étant donné que la seule nouveauté fonctionnelle à l’époque était l’effet coloré sur les bords de l’écran. En coulisses, les ingénieurs n’avaient même pas tranché sur l’approche à adopter. Ils ont pendant un temps envisagé d’intégrer un petit modèle de langage s’occupant des tâches simples, comme lancer un minuteur. Un second dans le nuage devait l’épauler en gérant les demandes plus complexes, comme réserver un taxi pour aller à un rendez-vous.
Ce compromis n’a pas fonctionné, et une option 100 % dans le nuage a été mise sur la table. Celle-ci a amené d’autres changements techniques importants, frustrant certains employés et en incitant certains à claquer la porte. Face à cette bérézina, décision a été prise de repousser la sortie de ce nouveau Siri. John Giannandrea et son lieutenant Robby Walker ont donc été remplacés par Craig Federighi et Mike Rockwell, auparavant à la tête de la division Vision Pro. Ce changement pourrait donner un nouveau souffle à l’assistant : Craig Federighi aurait demandé de construire « les meilleures fonctions d’IA », quitte à se baser sur des modèles open source de la concurrence.