OpenAI : bientôt un concurrent redoutable pour Alexa, Gemini et Siri

OpenAI a récemment déposé une demande de marque dans les catégories « assistants vocaux numériques » et « moteur vocal ». Ce dépôt de marque suggère que l’entreprise prévoit de lancer un assistant vocal génératif avec de meilleures capacités de reconnaissance et synthèse vocale que celles de ChatGPT. Alexa, Gemini et Siri n’ont qu’à bien se tenir !

VoiceGPT : un assistant vocal basé sur l’IA d’OpenAI ?

Alors que l’intelligence artificielle (IA) d’OpenAI continue de marquer des progrès significatifs dans le domaine de la génération de la parole, l’entreprise aurait déposé une demande de marque auprès auprès de l’US Patent and Trademark Office, le bureau américain des brevets et des marques, pour des produits liés aux catégories « assistants vocaux numériques » et « moteur vocal ».

Selon Business Insider, la demande de marque couvrirait spécifiquement les assistants vocaux, le traitement des commandes vocales, la génération audio à partir de prompts textuels, la reconnaissance et la traduction vocales multilingues, ainsi que la prestation de services vocaux, entre autres domaines. Si OpenAI propose déjà des technologies vocales et audio, notamment un moteur synthèse vocale et un modèle de reconnaissance vocale, la société n’a cependant pas encore d’assistant vocal grand public comme Alexa, Google Assistant ou Siri. Serait-elle sur le point d’en proposer un ?

« Nous publierons dans les mois à venir beaucoup de choses différentes, je pense qu’elles seront très cool » a déclaré Sam Altman au micro du podcasteur Lex Fridman. Et il ne s’agira pas de GPT-5, le directeur général d’OpenAI ajoutant « nous avons beaucoup d’autres choses importantes à publier en premier ».

ChatGPT a déjà de belles capacités vocales

Quoi qu’il en soit, les avancées d’OpenAI sur les technologies vocales sont assez impressionnantes. En effet, ChatGPT peut déjà répondre avec cinq voix différentes (Breeze, Cove, Ember, Juniper et Sky) dans pas moins de 37 langues, son intelligence artificielle détectant automatiquement la langue utilisée.

Bien qu’elle se soit jusqu’ici contentée de proposer une fonction de lecture audio des textes générés par son chatbot (Text-to-Speech), l’entreprise a également développé Whisper, un modèle de reconnaissance vocale qui permet au chatbot de comprendre la parole de l’utilisateur et de lui répondre vocalement. Bref, un assistant vocal comme Alexa, Google Assistant ou encore Siri.

À LIRE :
Les nouveautés Alexa AI à venir en 2024

Plus inquiétant encore pour les principaux acteurs du marché, le phrasé de l’assistant est particulièrement réussi. On y détecte certes un petit accent américain, voire même québécois en français, mais l’assistant est vraiment troublant et déjà bien plus naturel que celui de Google Assistant, sans toutefois égaler celui d’Alexa ou Siri. Bref, alors qu’Amazon peaufine son nouveau modèle d’IA pour Alexa et que Google semble vouloir remplacer son Assistant par Gemini, OpenAI pourrait bien bousculer le secteur dès cette année. Affaire à suivre.

 

Fasciné par Alexa depuis le jour où je l'ai reçue en bêta test, je me suis peu à peu passionné pour le sujet, avant de me décider à aller plus loin en créant un site avec Jean-Christophe. Une activité qui me permet d'étancher ma soif de nouvelles technologies et de partager mes découvertes sur la plus sympathique des communautés : Les Alexiens.