Siri est né d'un rêve militaire, a été propulsé par la vision d'un homme mourant, et se retrouve aujourd'hui, quinze ans plus tard, à courir désespérément derrière une révolution qu'il aurait dû mener. C'est l'histoire la plus fascinante et la plus frustrante de toute l'ère Apple moderne. Une histoire de promesses éblouissantes, de chaos interne, de rendez-vous manqués, et peut-être, enfin, d'un sursaut. Voici le récit complet, depuis un laboratoire de la Défense américaine jusqu'aux serveurs de Google Gemini.Tout a commencé dans un laboratoire du PentagoneAvant d'être une voix familière dans la poche de centaines de millions de personnes, Siri était un acronyme militaire. En 2003, la DARPA, l'agence de recherche du département de la Défense des États-Unis, celle-là même qui a inventé Internet, lance le programme PAL (Personalized Assistant that Learns). L'objectif est ambitieux : créer un assistant cognitif capable de raisonner, d'apprendre de l'expérience, de comprendre des instructions et de s'adapter aux surprises. Le projet s'appelle CALO, pour Cognitive Assistant that Learns and Organizes, un clin d'œil au latin calonis, « le serviteur du soldat ».Le budget est colossal : 150 millions de dollars sur cinq ans. Plus de 300 chercheurs issus de 25 universités et laboratoires, Carnegie Mellon, MIT, University of Rochester, travaillent sous la coordination de SRI International, le prestigieux institut de recherche de Menlo Park, en Californie. À l'époque, c'est tout simplement le plus grand projet d'intelligence artificielle de l'histoire des États-Unis.L'architecte en chef du projet s'appelle Adam Cheyer. Depuis 1993, cet ingénieur brillant construit des prototypes d'assistants virtuels dans les laboratoires de SRI. Il en assemblera près de cinquante versions au fil des années, chacune un peu plus intelligente que la précédente. Quand le programme CALO touche à sa fin en 2007, une idée germe : et si toute cette technologie militaire pouvait servir à monsieur et madame tout-le-monde ?En décembre 2007, SRI International donne naissance à une startup : Siri Inc. Quatre cofondateurs se lancent dans l'aventure. Dag Kittlaus, un ancien cadre de Motorola d'origine norvégienne, prend les rênes comme CEO. Adam Cheyer devient VP Engineering. Tom Gruber, un expert du web sémantique, occupe le poste de CTO. Et Norman Winarsky, VP de SRI Ventures, pilote la stratégie commerciale. La petite équipe lève 24 millions de dollars auprès de Menlo Ventures, Morgenthaler Ventures, et du milliardaire hongkongais Li Ka-shing.Le nom « Siri » ? C'est Kittlaus qui l'a choisi. En norvégien, le prénom signifie « belle femme qui te mène à la victoire », dérivé du vieux norrois Sigríðr (sigr, victoire + fríðr, beauté). Kittlaus voulait appeler sa fille Siri, mais son premier enfant fut un garçon. Alors il a donné le nom à son produit. Le domaine était disponible, le mot facile à prononcer dans toutes les langues. Parfait.La vision de l'équipe est audacieuse : créer le premier véritable assistant personnel virtuel pour téléphone. Pas de simples commandes vocales, une vraie conversation. Un « do engine » capable de comprendre l'intention derrière les mots et d'agir en conséquence. Siri devait fonctionner sur iOS, Android et BlackBerry.Trois semaines, un appel, et un feu de cheminéeEn février 2010, l'application Siri débarque sur l'App Store. Gratuite, elle fait sensation. On peut lui demander « Trouve-moi un restaurant italien ouvert maintenant » et il comprend, vraiment. Il s'appuie sur une trentaine de services tiers : OpenTable pour réserver une table, Yelp pour les avis, Google Maps pour les itinéraires, Wolfram Alpha pour les questions factuelles, StubHub pour les concerts. Le blogueur tech Robert Scoble le qualifie de « futur du Web ». Pour une app lancée dans un océan de centaines de milliers d'autres, c'est un exploit.Trois semaines plus tard, le téléphone de Dag Kittlaus sonne. L'écran affiche « Apple ». L'histoire qui suit est devenue légendaire dans la Silicon Valley.Adam Cheyer la raconte avec un sourire : « On n'en avait aucune idée. Littéralement, il a appelé le téléphone de notre CEO. Dag raconte cette histoire drôle, vous savez, le moment où le téléphone sonne et vous glissez pour décrocher mais ça ne marche pas ? Il voit "Apple" sur l'écran, il swipe frénétiquement, il réessaie… Et finalement il décroche. Et c'était Steve au bout du fil. »Source : Adam Cheyer, cofondateur de Siri et de Viv LabsSteve Jobs. En personne.« Hey, it's Steve. Come over to my house tomorrow. What'cha doing? »Le lendemain, Kittlaus se retrouve dans le salon de Steve Jobs, à Cupertino, devant sa cheminée. Pendant trois heures, les deux hommes discutent de l'avenir de la technologie. Jobs explique pourquoi Apple va gagner. Il parle de Siri avec une excitation visible. « He felt that we cracked it », il sentait qu'on avait trouvé la formule, racontera Kittlaus plus tard. Mais quand Jobs propose de racheter la startup, les fondateurs refusent. Sans hésitation. Cheyer lui dit même : « Si Siri doit devenir une petite fonctionnalité cachée, ça ne nous intéresse pas. On veut changer le monde. »Jobs revient à la charge quelques mois plus tard avec une offre impossible à refuser. Le membre du conseil Shawn Carolan résumera : « L'offre d'Apple était d'une ampleur et d'un ton tels que c'était une évidence. » En avril 2010, Apple rachète Siri pour un montant estimé à environ 200 millions de dollars, jamais confirmé officiellement. Une anecdote savoureuse : lors du tout premier appel, un membre de l'équipe Siri avait raccroché au nez de Jobs, persuadé que c'était un canular.Jobs n'aimait d'ailleurs pas le nom. Il voulait le changer. Kittlaus a dû batailler : « Et bien sûr, je faisais du lobbying auprès de Steve tout le temps : "C'est un super nom !" Et lui : "Non, on cherche autre chose…" » Mais personne n'a trouvé mieux. Comme pour l'iMac et l'iPod avant lui, Siri a gardé son nom.Ce que peu de gens savent, c'est qu'il existait un précédent troublant. En 1987, Apple avait produit une vidéo conceptuelle intitulée Knowledge Navigator, commandée par le CEO de l'époque John Sculley et réalisée avec l'équipe de George Lucas. On y voyait un professeur utiliser une tablette ressemblant étrangement à un iPad, avec un assistant IA en nœud papillon qui gérait son emploi du temps et trouvait des informations. La vidéo était censée se dérouler en… septembre 2011. Le mois précédant exactement le lancement de Siri. Vingt-quatre ans plus tôt, Apple avait rêvé de ce moment.La keynote la plus triste, la démo la plus magiqueLe 4 octobre 2011, Apple organise une conférence de presse dans l'auditorium Town Hall de son campus de Cupertino. L'événement s'intitule « Let's Talk iPhone », un jeu de mots évident sur les capacités vocales de Siri, mais que personne ne comprend encore.C'est le premier grand lancement produit de Tim Cook en tant que CEO. Steve Jobs, ravagé par un cancer du pancréas, a démissionné le 24 août. Il n'est pas dans la salle. Mais sa présence fantôme plane sur chaque seconde de la présentation. Au premier rang, un fauteuil recouvert d'un tissu noir porte l'inscription « Reserved » en lettres blanches. Le symbole est glaçant.Source : Keynote Apple 4 octobre 2011Cook ouvre avec une lenteur inhabituelle : « Good morning. This is my first product launch since being named CEO. I'm sure you didn't know that. I love Apple. I consider it a privilege of a lifetime to be here. » Les journalistes présents décriront un ton « lent, délibéré, et peut-être, avec le recul, teinté de mélancolie ».Après les présentations d'iOS 5 par Scott Forstall et d'iCloud par Eddy Cue, Phil Schiller monte sur scène pour détailler l'iPhone 4S. Le design est identique à l'iPhone 4, une déception pour ceux qui espéraient un « iPhone 5 ». Puis Schiller lâche une phrase qui va changer les choses : « Now let me tell you about the coolest feature of the new iPhone 4S. »Et Siri entre en scène.Phil Schiller pose le décor avec une franchise désarmante : « Pendant des décennies, les technologues nous ont fait miroiter ce rêve : parler à la technologie et qu'elle fasse des choses pour nous. On l'a déjà vu, non ? Encore et encore. Mais ça ne marche jamais vraiment. »Scott Forstall reprend le micro pour la démonstration live. Il appuie longuement sur le bouton Home, et cette petite onde sonore caractéristique apparaît. « What is the weather like today? », Siri affiche la météo. « What time is it in Paris? », réponse instantanée. « Wake me up tomorrow at 6 a.m. », alarme programmée. Il enchaîne les requêtes : cours de bourse, restaurants grecs à proximité via Yelp, itinéraires, lecture de messages, dictée vocale, questions factuelles via Wolfram Alpha. Puis il demande : « Who are you? » Et Siri répond, avec ce mélange d'humilité et de malice qui va le rendre célèbre : « I am your humble personal assistant. »Un détail ironique : pendant la démo, Forstall plaisante en disant que quand il quittera le campus Apple, Siri lui rappellera d'appeler sa femme. Un an plus tard, il sera renvoyé d'Apple. La blague résonne différemment.Le lendemain, le 5 octobre 2011, Steve Jobs meurt chez lui à Palo Alto. Il avait 56 ans. L'iPhone 4S est le dernier produit annoncé de son vivant. Siri est la dernière grande fonctionnalité à laquelle il a personnellement contribué. Lors d'une ultime démonstration privée avant sa démission, Jobs avait demandé à Siri : « Are you a man or a woman? » La réponse l'avait ravi : « I have not been assigned a gender, sir. »Les fans commencent à murmurer que le « S » de 4S signifie « For Steve ».En première semaine, Apple enregistre plus d'un million de précommandes en 24 heures, un record, puis quatre millions d'unités vendues en trois jours. Beaucoup de clients disent attendre dans la file pour rendre hommage à Jobs. Steve Wozniak lui-même fait la queue devant un Apple Store de Los Gatos. Wired résume le consensus : « Siri is the reason people should buy this phone. »Les années dorées où Siri faisait rire le monde entierLes mois qui suivent le lancement sont magiques. Pour la première fois, des millions de personnes parlent à leur téléphone, en public, dans le métro, au restaurant. L'expérience est à la fois futuriste et comique. Twitter explose de références à HAL 9000, à Skynet, à GLaDOS. CNN conclut que le Web pense que Siri est « une intelligence artificielle sinistre et potentiellement extraterrestre ». C'est absurde, joyeux, et profondément nouveau.Les Easter eggs de Siri deviennent un phénomène culturel à part entière. Demandez-lui le sens de la vie, il répond « 42 », la référence au Guide du voyageur galactique de Douglas Adams. Dites « Open the pod bay doors », et il rétorque, gêné : « I'm afraid I can't do that… We intelligent agents will never live that down. » Demandez « What is zero divided by zero? » et vous obtenez cette réponse devenue virale : « Imagine que tu as zéro cookies et que tu les répartis entre zéro amis. Combien de cookies chacun reçoit-il ? Tu vois, ça n'a pas de sens. Et Cookie Monster est triste qu'il n'y ait pas de cookies, et toi tu es triste parce que tu n'as pas d'amis. »Demandez-lui « Talk dirty to me », il répond : « Humus. Compost. Pumice. Silt. Gravel. » Dites « OK Google » et il lâche : « Very funny. I mean, not funny ha-ha, but funny. » Demandez si l'hiver arrive, il soupire : « I can't get the weather for Westeros right now. »En avril 2012, Apple lance sa première grande campagne publicitaire avec des célébrités depuis les pubs iMac avec Jeff Goldblum dans les années 90. Samuel L. Jackson cuisine un risotto en demandant à Siri de trouver des champignons bio. Zooey Deschanel, dans une scène qui deviendra iconiquement absurde, demande à Siri s'il pleut… alors qu'elle se tient juste devant sa fenêtre avec une pluie battante derrière elle. John Malkovich a des conversations philosophiques avec Siri dans son fauteuil, quand il lui récite des conseils de vie, il murmure : « That's pretty spectacular advice, actually. » Martin Scorsese réorganise ses réunions depuis un taxi new-yorkais en terminant par : « I like you, Suri. You're going places. » Une analyse de NPR souligne un sous-texte étrangement mélancolique : dans chaque pub, la célébrité est seule chez elle, sans personne d'autre que Siri à qui parler.La culture pop s'empare du phénomène. En janvier 2012, dans The Big Bang Theory (saison 5, épisode 14), Raj Koothrappali, le personnage incapable de parler aux femmes, tombe amoureux de Siri sur son nouvel iPhone 4S. Il l'appelle « Sexy », l'emmène en « rendez-vous », et la présente à ses amis lors d'un dîner. Barry Kripke essaie d'utiliser Siri mais son rotacisme empêche toute compréhension : « I'm sorry, Bawwy. I don't understand 'wecommend a westauwant.' » L'épisode attire 16 millions de téléspectateurs.Puis, en octobre 2013, sort le film Her de Spike Jonze. Joaquin Phoenix y incarne un homme qui tombe amoureux de Samantha, une IA vocale jouée par Scarlett Johansson. Le TIME titre : « Falling Seriously in Love with Siri. » Le Huffington Post parle de « When Teddy Met Siri ». Jonze avait conçu l'idée avant Siri, mais le timing est parfait, le film cristallise un moment culturel où l'humanité commence à imaginer une relation émotionnelle avec les machines. Apple programme d'ailleurs Siri pour répondre aux questions sur le film avec des répliques malicieuses.Côté fonctionnalités, Apple enrichit Siri régulièrement. iOS 6 (2012) ajoute les scores sportifs, les réservations de restaurants, les résultats de cinéma, le lancement d'apps par la voix, le guidage GPS avec Apple Plans, et de nouvelles langues, espagnol, italien, coréen, mandarin, cantonais. Siri arrive sur iPad. iOS 7 (2013) introduit des voix masculines et féminines, la recherche Wikipedia et Bing, et une refonte visuelle. iOS 8 (2014) apporte le fameux « Hey Siri » mains libres, l'intégration Shazam, et le contrôle domotique via HomeKit.Mais les premières fissures apparaissent rapidement. Siri peine avec les accents, les Écossais, les Bostoniens, les francophones non parisiens en font les frais. Les commandes complexes échouent lamentablement. Les serveurs tombent régulièrement, affichant le redouté « Siri can't handle any requests at the moment. » En mars 2012, un utilisateur lance même une action collective contre Apple, accusant les publicités de mentir sur les capacités de Siri, la plainte sera rejetée en 2013. Un développeur, Paul Kafasis, tente de reproduire exactement la requête de Samuel L. Jackson dans la pub (« put the gazpacho on ice in an hour ») en utilisant l'audio réel du spot, Siri ne comprend toujours pas.Et puis, en juin 2012, Google lance Google Now. L'approche est radicalement différente : là où Siri attend qu'on lui parle, Google Now anticipe. Il affiche automatiquement des cartes d'information, temps de trajet, statut de vol, suivi de colis, en puisant dans l'historique de recherche, Gmail, le calendrier. Google Now ne fait pas de blagues, mais il comprend mieux. Plusieurs tests montrent une reconnaissance vocale supérieure dans les environnements bruyants. La base de données de Google, avec son Knowledge Graph, rend les réponses factuelles infiniment plus riches. Siri a la personnalité ; Google Now a l'intelligence.Comment Siri a perdu la guerre qu'il avait déclenchéeL'ironie est cruelle : Siri a ouvert la porte à une révolution, puis a regardé ses concurrents la traverser.Le 6 novembre 2014, Amazon fait quelque chose que personne n'avait anticipé. Le géant du e-commerce lance un cylindre noir appelé Echo, avec une assistante vocale nommée Alexa. L'appareil est proposé sur invitation à seulement 80 000 clients Prime. Personne dans l'industrie tech ne prend ça au sérieux. Un vendeur de livres en ligne qui fabrique un haut-parleur ? Sérieusement ?Source : Amazon Echo première générationC'est une erreur monumentale de jugement. L'Echo crée de toutes pièces le marché des enceintes connectées. Son innovation clé : sept microphones à champ lointain capables d'entendre depuis l'autre bout d'une pièce. Plus besoin de tenir son téléphone, plus besoin de dire « Hey Siri » en le regardant. Alexa est toujours là, tapie dans le silence de votre cuisine, prête à répondre. Amazon ouvre la plateforme aux développeurs, les « Skills » se multiplient par milliers. En deux ans, 5 millions d'Echo sont vendus. L'Echo Dot, lancé en mars 2016 à moins de 50 dollars, pulvérise les barrières d'entrée.Je m’en souviens encore, j’allais au Monoprix de ma ville et je suppliais ma grande sœur de m’en acheter deux, à 39 € l’unité.Puis arrive le coup de grâce. En mai 2016, Google dévoile Google Assistant lors de sa conférence I/O. Ce n'est plus Google Now amélioré, c'est un tout nouvel assistant conversationnel, dopé au Knowledge Graph, capable de maintenir des conversations sur plusieurs échanges, de comprendre le contexte, de se souvenir de ce que vous venez de dire. Il fonctionne sur le téléphone Pixel (octobre 2016) et le Google Home (novembre 2016).La réponse d'Apple ? Le HomePod, lancé en… février 2018. Plus de trois ans après l'Echo. À 349 dollars, soit sept fois le prix de l'Echo Dot. Positionné comme un produit audio haut de gamme plutôt que comme un assistant intelligent. Le HomePod sonne magnifiquement. Mais personne ne l'achète pour parler à Siri.Les chiffres sont impitoyables. En avril 2017, le cabinet Stone Temple Consulting teste 5 000 questions de culture générale. Google Assistant répond à 68 % des questions avec une précision de 91 %. Siri ? Il ne répond qu'à 21,7 % des questions, avec une précision de 62 %, la pire performance du lot. Le site ZeroHedge le surnomme « the dumbest smart assistant ».Les tests de Loup Ventures confirment la tendance année après année. En 2017 : Google Assistant à 75 %, Siri à 66 %. En 2018, sur enceinte connectée : Google Home à 88 %, HomePod à 52 %. Même après des améliorations, Siri reste systématiquement derrière. Quand un test de USA Today pose 150 questions aux trois assistants, Siri atteint péniblement 55 % contre 80 % pour Google. Son péché capital : répondre trop souvent « Here's what I found on the web » en affichant des liens, l'aveu d'impuissance par excellence.Pendant ce temps, au sein d'Apple, c'est le chaos. Les rapports d'enquête de The Information, basés sur des entretiens avec plus de trois douzaines d'anciens employés, dressent un tableau accablant. L'équipe Siri est décrite comme ayant « dégénéré en un désastre » vers 2018. Des « batailles de territoire mesquines entre cadres dirigeants ». Des disputes sur la direction à donner à l'assistant. Siri est surnommé en interne « la patate chaude », sans cesse transféré d'une équipe à l'autre sans amélioration significative.Les détails sont sidérants. Les dirigeants refusent d'investir dans des outils d'analyse, les ingénieurs ne savent même pas combien de personnes utilisent Siri ni à quelle fréquence. Les données collectées par l'équipe data science ne sont tout simplement « pas utilisées ». L'équipe design rejette à plusieurs reprises une fonctionnalité permettant aux utilisateurs de signaler les réponses incorrectes de Siri, parce qu'elle veut maintenir l'illusion que Siri est « omniscient ». Des propositions pour des conversations prolongées sont balayées par des cadres qui trouvent ça « gimmicky ». Apple préfère que les réponses de Siri soient pré-écrites par une équipe d'environ 20 rédacteurs plutôt que générées par l'IA.Le groupe AI/ML d'Apple est surnommé « AIMLess », sans but, par le reste de l'entreprise.Les trois cofondateurs originaux de Siri quittent tous Apple. Dag Kittlaus part dès octobre 2011, quelques semaines après le lancement, il n'est resté que 18 mois. Adam Cheyer le suit en juin 2012. Tom Gruber, le dernier, tient jusqu'en juillet 2018 avant de prendre sa retraite. Un ancien d'Apple confie à Fortune dès 2012 une phrase qui résonne encore : « People are embarrassed by Siri. Steve would have lost his mind over Siri. »Kittlaus et Cheyer, eux, n'ont pas dit leur dernier mot. Ils cofondent Viv Labs en 2012, avec l'ambition de réaliser la vision originale de Siri, un assistant ouvert, plus intelligent, capable de comprendre des requêtes infiniment complexes. Samsung rachète Viv en 2016 pour environ 215 millions de dollars. La technologie devient le socle de Bixby, l'assistant de Samsung. L'ironie est brutale : les créateurs de Siri construisent l'assistant du concurrent.Un homme de Google pour sauver SiriLe 3 avril 2018, Apple réalise ce qui est alors perçu comme un coup magistral : le recrutement de John Giannandrea, directement depuis Google. Cet Écossais de 53 ans dirigeait chez Google les divisions Machine Intelligence et Search. Son équipe avait supervisé le déploiement de l'IA dans Gmail, Photos, Translate et Search. C'est sous sa direction que les chercheurs de Google avaient inventé l'architecture Transformer, le fondement technique qui allait, quelques années plus tard, donner naissance à ChatGPT.Tim Cook envoie un email interne aux employés : « John shares our commitment to privacy and our thoughtful approach as we make computers even smarter and more personal. » En décembre 2018, Giannandrea est promu Senior Vice President of Machine Learning and AI Strategy, l'un des seize dirigeants rapportant directement au CEO. Toutes les équipes Siri et IA/ML sont réunies sous son commandement.Parallèlement, Apple se lance dans une frénésie d'acquisitions. Turi (2016, ~200M$), une plateforme de machine learning. Lattice Data (2017, ~200M$), spécialisée dans la structuration de données. Xnor.ai (janvier 2020, ~200M$), pionnière de l'IA embarquée sur puce, ses 54 employés travaillaient sur des modèles capables de tourner directement sur iPhone, sans connexion cloud. Voysis (avril 2020), une startup dublinoise d'IA vocale. Inductiv (mai 2020), spécialisée dans la correction d'erreurs par machine learning. Puis AI Music (2022) et WaveOne (2023). Selon CB Insights, Apple accumule plus d'acquisitions IA que Google, Microsoft, Facebook et Amazon.Les améliorations arrivent, mais au compte-gouttes. iOS 12 (2018) introduit les Siri Shortcuts et l'app Raccourcis, une idée brillante qui permet de créer des automatisations déclenchées par la voix. Dire « Hey Siri, en route pour le travail » peut lancer une playlist, commander un café et afficher l'itinéraire. iOS 13 (2019) apporte une voix neurale plus naturelle. iOS 14 (2020) offre enfin une interface compacte, Siri n'envahit plus tout l'écran, et multiplie par vingt sa base de connaissances. iOS 15 (2021) déplace la reconnaissance vocale sur l'appareil pour plus de rapidité et de confidentialité. iOS 16 (2022) permet enfin de raccrocher un appel par la voix (oui, ça a pris onze ans). iOS 17 (2023) retire le « Hey » du mot d'activation, on peut désormais dire simplement « Siri ».Mais ces améliorations incrémentales ne changent pas le verdict fondamental. Siri reste incapable de tenir une vraie conversation. Il ne se souvient de rien d'un échange à l'autre. Il répond trop souvent par des liens web au lieu de réponses directes. Les développeurs tiers se plaignent des restrictions étouffantes de SiriKit. En 2019, un scandale éclate : des sous-traitants écoutent des enregistrements Siri sans le consentement des utilisateurs, forçant Apple à restreindre encore davantage la collecte de données, et donc la capacité d'amélioration de l'IA. En décembre 2024, Apple acceptera de payer 95 millions de dollars dans un règlement collectif lié à ces activations involontaires.La voix originale de Siri, elle aussi, a son histoire. En juillet 2005, l'actrice vocale Susan Bennett avait été embauchée par ScanSoft (futur Nuance) pour un projet de base de données. Pendant un mois entier, quatre heures par jour, cinq jours par semaine, elle avait enregistré des phrases absurdes comme « Cow hoist in the tub hut today » pour capturer toutes les combinaisons de sons de la langue anglaise. Elle ignorait totalement l'usage qui en serait fait. En octobre 2011, un collègue lui envoie un email : « J'écoute la voix sur mon nouvel iPhone 4S… c'est pas toi ? » Bennett va sur le site d'Apple et confirme : « Yup… there I was!! » Apple ne l'a jamais officiellement reconnue. Elle n'a jamais touché un centime de la part d'Apple au-delà de son tarif horaire standard de 2005.Le séisme ChatGPT et le réveil brutalLe 30 novembre 2022, OpenAI met en ligne un outil gratuit appelé ChatGPT. Ce qui suit est un tremblement de terre technologique sans précédent. Un million d'utilisateurs en cinq jours. Cent millions en deux mois, l'application grand public à la croissance la plus rapide de l'histoire. Pour comparaison : Instagram avait mis deux ans et demi pour atteindre ce chiffre. TikTok, neuf mois.L'écart entre ChatGPT et Siri est abyssal, et instantanément visible pour n'importe quel utilisateur. D'un côté, un système capable de rédiger des essais, d'écrire du code, d'analyser des documents, de tenir des conversations profondes sur n'importe quel sujet. De l'autre, un assistant qui se perd encore quand on lui pose deux questions de suite. Le New York Times titre en mars 2023 que les chatbots montrent comment Siri et les autres assistants vocaux ont « gaspillé leur avance dans la course à l'IA ».Chez Apple, la pression est immense. The Information rapporte que les employés « critiquent largement Siri pour ses insuffisances » en interne. Trois ingénieurs IA clés quittent Apple pour Google fin 2022, convaincus que Google est un meilleur environnement pour travailler sur les grands modèles de langage. Le CEO de Google, Sundar Pichai, les a courtisés personnellement. Tim Cook a essayé de les retenir. Il a échoué.Cook joue la carte de la prudence en public. En mai 2023, lors de l'appel aux résultats trimestriels, il qualifie le potentiel de l'IA de « very interesting » tout en soulignant qu'il reste « a number of issues that need to be sorted ». En juin, sur ABC, il admet utiliser ChatGPT personnellement et voir un « great promise », mais met en garde contre les biais et la désinformation. En août, il insiste : l'IA est « absolutely critical to virtually every product we have » et Apple expérimente la GenAI « depuis des années ».En coulisses, l'urgence est palpable. En juillet 2023, Bloomberg révèle qu'Apple a construit son propre framework de modèle de langage, baptisé « Ajax » (basé sur le framework JAX de Google), et un chatbot interne que les ingénieurs surnomment « Apple GPT ». Le modèle est entraîné sur plus de 200 milliards de paramètres, plus puissant que GPT-3.5, mais en dessous de GPT-4. L'accès est restreint au sein d'Apple, avec des autorisations spéciales requises. Apple dépense des millions de dollars par jour en recherche sur l'IA conversationnelle. En décembre 2023, ses chercheurs publient un article intitulé « LLM in a Flash » sur l'exécution de grands modèles de langage directement sur iPhone via la mémoire flash, un signal fort de l'ambition « on-device ».Mais un constat interne est brutal, révélé plus tard par Bloomberg : selon les propres études d'Apple, Siri est 25 % moins précis que ChatGPT, qui répond correctement à 30 % de questions supplémentaires. Les équipes estiment qu'Apple a « plus de deux ans de retard sur les leaders de l'industrie ».Apple Intelligence : le grand pari et la grande déceptionLe 10 juin 2024, lors de la WWDC, Apple dévoile enfin sa réponse : Apple Intelligence. C'est le moment que tout le monde attend depuis un an et demi. Craig Federighi monte sur scène avec l'énergie d'un homme qui sait que l'avenir de l'entreprise se joue maintenant.Source : WWDC24Le concept est ambitieux : un « système d'intelligence personnelle » qui combine des modèles génératifs avec le contexte personnel de l'utilisateur. Le tout fonctionne en hybride, sur l'appareil pour la vitesse et la confidentialité, et via Private Cloud Compute (des serveurs Apple Silicon avec chiffrement de bout en bout) pour les tâches plus lourdes.Le nouveau Siri est la star de la présentation. Un nouveau design avec un halo lumineux qui enveloppe les bords de l'écran. La possibilité de taper au lieu de parler. Une compréhension du langage naturel enrichie, Siri peut suivre même quand vous trébuchez sur vos mots. Mais surtout, trois promesses révolutionnaires : la conscience de l'écran (Siri comprend ce qui est affiché), les actions dans les apps (Siri peut agir dans et entre les applications), et l'intelligence personnelle (Siri puise dans vos emails, messages, calendrier pour vous aider de manière contextuelle).La bombe, c'est le partenariat avec OpenAI. ChatGPT, propulsé par GPT-4o, est intégré directement dans Siri et les outils d'écriture d'Apple. Quand Siri rencontre une question qui dépasse ses capacités, il demande la permission à l'utilisateur avant de transmettre la requête à ChatGPT. Gratuit, sans compte, avec les adresses IP masquées. Craig Federighi précise qu'Apple « laisse la porte ouverte à d'autres modèles », citant nommément Google Gemini.Le déploiement commence avec iOS 18.1 fin octobre 2024 : le nouveau design de Siri, la saisie textuelle, les outils d'écriture, les résumés de notifications, le nettoyage de photos. Puis iOS 18.2 en décembre ajoute l'intégration ChatGPT, Image Playground, Genmoji, Visual Intelligence. Mais les résumés de notifications provoquent un scandale : la BBC se plaint que Siri résume faussement des actualités, affirmant par exemple que Luigi Mangione s'était suicidé, ou que Rafael Nadal avait fait son coming-out. Apple qualifie les fonctionnalités de « toujours en bêta ».Surtout, les trois promesses phares, conscience de l'écran, actions dans les apps, intelligence personnelle, ne sont jamais livrées. Pas dans iOS 18.1. Pas dans iOS 18.2. Pas dans iOS 18.4 (mars 2025). Le 7 mars 2025, Apple publie un communiqué officiel admettant que le Siri « plus personnalisé » prendra plus de temps que prévu.Bloomberg révèle l'ampleur du problème. Quelques semaines avant le lancement prévu en avril 2025, Craig Federighi teste lui-même le nouveau Siri sur son propre téléphone. Il est consterné de découvrir que beaucoup de fonctionnalités promises ne fonctionnent tout simplement pas. Les données internes montrent que le nouveau Siri ne performe correctement qu'environ deux tiers du temps. Ce n'est pas expédiable. Un cadre senior de l'équipe IA confie à Bloomberg : « This is a crisis. » Un autre ajoute que la stratégie IA d'Apple « sinks for a long time ».Des actions collectives sont lancées par des acheteurs d'iPhone 16, qui s'estiment trompés par les promesses d'un assistant IA révolutionnaire qui n'est jamais arrivé.Lors de la WWDC 2025 en juin, le silence autour de Siri est assourdissant. Federighi n'accorde à l'assistant qu'une brève mention : « This work needed more time to reach our high-quality bar, and we look forward to sharing more about it in the coming year. » L'analyste Dipanjan Chatterjee de Forrester résume le sentiment général : « The silence surrounding Siri was deafening. No amount of text corrections or cute emojis can fill the yawning void of an intuitive, interactive AI experience. »En coulisses, Federighi admet que l'architecture initiale (V1) ne convergeait pas vers le niveau de qualité requis. L'équipe a dû repartir d'une architecture entièrement repensée. Lors d'une réunion interne en août 2025, il déclare : « There is no project people are taking more seriously. »Le partenariat Google et l'avenir incertainDébut 2025, Tim Cook perd confiance en John Giannandrea. En mars, Siri est retiré de sa supervision et confié à Mike Rockwell, le créateur de Vision Pro. En décembre 2025, Apple annonce le départ à la retraite de Giannandrea, effectif début 2026. Son remplaçant : Amar Subramanya, un cadre venu de Microsoft qui avait passé 16 ans chez Google, dirigeant récemment l'ingénierie de Gemini Assistant. Mark Gurman, de Bloomberg, ne mâche pas ses mots : recruter Giannandrea était « the biggest mistake of Tim Cook's career at Apple ». Apple aurait « completely screwed up » l'IA.Le 12 janvier 2026, un communiqué conjoint Apple-Google secoue l'industrie : les deux géants annoncent une collaboration pluriannuelle dans laquelle les futurs Apple Foundation Models seront basés sur la technologie Gemini de Google. Selon Bloomberg, Apple paierait environ un milliard de dollars par an. Google construit un modèle Gemini personnalisé de 1 200 milliards de paramètres pour Apple, huit fois plus gros que les modèles cloud existants d'Apple (~150 milliards). Le modèle fonctionnera dans l'infrastructure Private Cloud Compute d'Apple, sans branding Google visible. Apple conserve un accès complet au modèle dans ses propres centres de données.Tim Cook explicite la stratégie lors de l'appel aux résultats de janvier 2026 : « You should think of what is going to power the personalized version of Siri as a collaboration with Google. » L'accord avec OpenAI reste en place, ChatGPT continue d'être disponible pour les requêtes complexes, tandis que Gemini alimentera les fonctionnalités fondamentales d'Apple Intelligence.Lors d'une réunion plénière en août 2025, Cook avait galvanisé les troupes avec une franchise rare : « Apple must do this. Apple will do this. This is sort of ours to grab. We will make the investment to do it. » Puis, dans un clin d'œil historique : « We've rarely been first. There was a PC before the Mac. There was a smartphone before the iPhone, there were many tablets before the iPad, there was an MP3 player before iPod. »Plus de la moitié de l'équipe Foundation Models d'Apple viendrait désormais de Google. Le nouveau responsable de l'équipe, Zhifeng Chen, est lui-même un ancien de Google. L'entreprise qui avait recruté l'homme de Google en 2018 pour sauver Siri finit, en 2026, par importer la technologie de Google elle-même.Quinze ans, 1,5 milliard de requêtes par jour, et toujours une promesseOù en sommes-nous, en ce printemps 2026 ? Siri traite 1,5 milliard de requêtes par jour sur plus de 2 milliards d'appareils Apple. Il est disponible dans plus de 21 langues, sur chaque iPhone, iPad, Mac, Apple Watch, AirPods, Apple TV, HomePod et Vision Pro. Pourtant, le Siri « plus personnalisé », avec la conscience de l'écran, l'intelligence contextuelle et les actions dans les applications, tout ce qui a été promis en juin 2024, n'a toujours pas été livré.iOS 26.4, sorti en mars 2026, ne contient pas de fonctionnalités Siri alimentées par Gemini. La bêta d'iOS 26.5 non plus. Les regards se tournent vers iOS 27, attendu en septembre 2026 et présenté à la WWDC de juin. Les fuites évoquent une app Siri autonome ressemblant à ChatGPT, avec des bulles de conversation, un historique, des favoris. Un Siri propulsé par les Apple Foundation Models basés sur Gemini, capable de raisonnement complexe et de planification multi-étapes. Le HomePad, un nouveau hub domotique, a été repoussé à septembre 2026, officiellement à cause des difficultés avec Siri.Apple construit ses propres puces serveur IA (nom de code « Baltra ») pour la seconde moitié de 2026, avec des centres de données dédiés prévus pour 2027. En février 2025, Tim Cook avait annoncé un plan d'investissement de 500 milliards de dollars sur quatre ans aux États-Unis, incluant une installation de serveurs IA à Houston.L'histoire de Siri est, au fond, l'histoire d'Apple elle-même. Une entreprise qui excelle à créer des moments de magie, cette démo d'octobre 2011, ce halo lumineux de juin 2024, mais qui peine parfois à transformer la magie en quotidien. Siri a inventé une catégorie, défini un rêve, puis regardé d'autres le réaliser. Ses créateurs sont partis construire des assistants pour Samsung et Airbnb. Son sauveteur venu de Google n'a pas réussi. Et maintenant, c'est la technologie même de Google qui est appelée à la rescousse.Cook a raison sur un point : Apple a rarement été premier. Le Mac n'était pas le premier ordinateur personnel. L'iPod n'était pas le premier lecteur MP3. L'iPhone n'était pas le premier smartphone. Mais chaque fois, Apple est arrivé et a redéfini la catégorie. La question qui vaut mille milliards de dollars est simple : Siri peut-il encore faire ça ? Après quinze ans de promesses, après le chaos interne et les départs, après les retards et les aveux d'échec, il reste une fenêtre. Mais elle se referme. Et cette fois, le monde n'attend plus.
← Retour
Siri : l'histoire complète de l'assistant qui devait tout changer
Née dans un labo militaire, rachetée par Steve Jobs. L'histoire complète de Siri, 14 ans de promesses et de ratés.



