Depuis deux ans, Amazon travaille activement à une refonte majeure d’Alexa afin d’y intégrer des capacités d’intelligence artificielle (IA) générative avancées. Nommée Remarkable Alexa, cette nouvelle version a pour objectif de transformer l’assistant vocal en un agent d’IA capable de réaliser des tâches plus complexes et personnalisées, afin d’en faire bien plus qu’un simple gestionnaire de commandes vocales pour la domotique. Alors que cette évolution était attendue en octobre dernier, son lancement a finalement été repoussé à 2025, le géant de Seattle faisant face à de nombreux défis techniques, comme l’a récemment expliqué Rohit Prasad au Financial Times.
Remarkable Alexa : de nombreux défis techniques
Nous l’évoquions en novembre dernier, Amazon rencontre quelques difficultés avec Remarkable Alexa, qui ont conduit à des retards dans son calendrier de lancement, initialement prévu pour 2024 et désormais reporté au second semestre 2025. Avec cette nouvelle version, l’entreprise aspire à faire d’Alexa bien plus qu’un simple assistant vocal et cherche à la doter d’une compréhension contextuelle avancée, ainsi que d’une capacité à exécuter des tâches complexes, grâce à une IA générative comparable à des modèles comme ChatGPT ou Gemini. En plus d’améliorations conversationnelles notables, Alexa sera plus déductive et plus proactive. Elle pourra, par exemple, ajuster la température en fonction de notre présence, lancer nos robots aspirateurs pendant nos absences, régler la luminosité d’une pièce selon la luminosité ambiante, anticiper nos besoins d’après nos plannings, nous proposer des recettes personnalisées à partir des ingrédients disponibles dans nos réfrigérateurs, et plus encore.
Dans une récente interview, Rohit Prasad, le responsable de l’intelligence artificielle chez Amazon, a expliqué au Financial Times pourquoi Alexa n’a pas encore été en mesure de rattraper ses nouveaux concurrents malgré leurs importantes ressources en la matière. Selon lui, l’entreprise doit encore surmonter « plusieurs obstacles techniques » avant de lancer Remarkable Alexa.
Les hallucinations de l’IA
Parmi eux figurent les hallucinations de l’IA. Il s’agit d’erreurs qui se produisent lorsqu’une IA génère des réponses qui ne correspondent pas à la réalité avec des informations incorrectes ou inventées. Un problème qui est loin d’être rare avec ChatGPT ou Claude AI qui, parfois, inventent purement et simplement des choses. En effet, il faut savoir que lorsque vous leur posez des questions, ces IA vont générer des réponses en se basant sur des probabilités dans des ensembles de données, sans pour autant vérifier la véracité de ces sorties. Même si les chances d’erreur sont statistiquement faibles du fait de l’utilisation de modèles toujours plus vastes, elles n’en demeurent pas moins possibles et les IA peuvent, notamment, inventer des citations, créer des références fictives ou donner des réponses fausses. Au lieu de tout simplement vous dire « désolé, je ne sais pas » comme le ferait actuellement Alexa, ces modèles d’IA ont plutôt tendance à générer des réponses qui, bien que probables, peuvent être à mille lieues de la réalité. Ajoutez à cela le fait que leurs sources sont parfois biaisées ou incorrectes, et vous comprendrez mieux pourquoi les IA sont encore loin d’être fiables. Vous le constaterez sans mal si vous les interrogez sur vos domaines d’expertise, en particulier sur des points de détail.
C’est un vrai problème pour Amazon car Alexa est utilisée au quotidien par des millions de personnes. Ces hallucinations peuvent donc être problématiques. Par exemple, si vous demandez à Alexa quel temps il fera cet qu’elle invente une réponse, cela peut totalement ruiner vos projets. Rohit Prasad précise que l’objectif d’Amazon est de ramener ces hallucinations « à près de zéro » et que ses équipes « travaillent extrêmement dur sur ce problème ». Pour ce faire, il faut notamment combiner l’IA avec des systèmes de vérification des faits en temps réel, ce qui pose un autre problème…
Plus de latence dans les réponses
Ce second problème est la latence. En effet, si nous pouvons facilement accepter d’attendre quelques secondes pour obtenir une réponse à une question d’actualité ou de culture générale, ça n’est plus du tout le cas lorsqu’il s’agit d’effectuer une action telle que mettre de la musique ou allumer la lumière. Si une commande vocale prend plus de temps que l’action physique, vous risquez de ne plus l’utiliser. C’est d’autant plus vrai qu’Alexa nous a habitués à être particulièrement performante en domotique et que nous tenons pour acquises ses compétences. La vitesse de traitement reste donc un point critique, car les utilisateurs attendent des interactions fluides et immédiates, mais Amazon semble avoir avancé sur ce sujet depuis septembre.
Intégration avec les systèmes existants d’Alexa
Le défi majeur réside dans l’intégration des nouvelles fonctionnalités d’IA avec l’infrastructure existante d’Alexa. Contrairement aux rumeurs qui avaient émergées dans la presse américaine ces derniers mois, Amazon n’a pas choisi de remplacer complètement ses algorithmes par des grands modèles de langage (LLM). Remarkable Alexa utilisera donc une combinaison de LLM, notamment les modèles Amazon Nova et Claude AI d’Anthropic, pour apporter de nouvelles capacités d’IA générative à l’assistant vocal que nous connaissons. Cependant, ces LLM doivent encore s’interfacer d’une manière ou d’une autre avec l’infrastructure existante d’Alexa, ce qui est l’une des sources de friction.
« La nouvelle Alexa utilise un bouquet de différents modèles d’IA pour reconnaître, traduire les requêtes vocales et générer des réponses, ainsi que pour identifier les violations de politique, telles que la détection de réponses inappropriées et d’hallucinations », explique Rohit Prasad. « La création de logiciels permettant de traduire entre les systèmes existants et les nouveaux modèles d’IA a été un obstacle majeur à l’intégration Alexa-LLM. »
Alexa est aussi connectée à une multitude de services tiers, en particulier pour la maison connectée. Ces appareils domestiques intelligents génèrent des milliards de requêtes hebdomadaires et s’assurer de leur compatibilité tout en améliorant les capacités d’Alexa représente une tâche complexe pour les ingénieurs d’Amazon. « Parfois, nous sous-estimons le nombre de services intégrés à Alexa, et c’est un nombre énorme », confie le grand chef de l’IA chez Amazon qui précise que ses équipes ont « encore beaucoup de choses à faire », comme s’assurer qu’il fonctionne « près de 100 % du temps », ajouter des filtres de sécurité pour enfants et tester diverses intégrations natives d’Alexa.
Un nouveau modèle économique crucial
Pour renforcer les capacités d’Alexa, Amazon a investi massivement dans des technologies d’IA. L’entreprise a notamment injecté 8 milliards de dollars dans Anthropic, la startup créatrice du modèle Claude AI. Ce partenariat permettra d’intégrer des modèles d’IA de pointe dans Alexa, en complément des développements réalisés en interne. Comme nous l’avions déjà indiqué, Amazon envisage donc de proposer un abonnement Remarkable Alexa compris entre 5 et 10 dollars par mois, afin de générer des revenus supplémentaires et compenser les pertes financières antérieures liées à la division Alexa, qui aurait enregistré de lourdes pertes entre 2017 et 2021. Une approche qui suscite cèpe des interrogations quant à l’acceptation des consommateurs, surtout face à des concurrents tels que Google et Apple, qui préparent également des mises à jour de leurs assistants vocaux respectifs. Si le premier ne s’est pas exprimé sur le sujet, le second a de son côté promis que les améliorations apportées par l’IA seront gratuites sur ses appareils.
Malgré ces nombreux défis, les équipes d’Amazon semblent bien déterminées à transformer Alexa en un assistant vocal de nouvelle génération. L’entreprise continue d’investir dans la recherche et le développement pour surmonter les obstacles techniques, la réussite de ce projet étant à même de renforcer sa position dans le domaine de la maison connectée, mais aussi de l’intelligence artificielle grand public.