Avec GPT-4o, OpenAI ridiculise nos assistants vocaux

Lors de sa très attendue conférence, OpenAI a levé hier soir le voile sur son dernier modèle d’intelligence artificielle générative, GPT-4o, disponible dès aujourd’hui via ChatGPT. Cette annonce marque une nouvelle avancée significative dans le domaine de l’IA, avec des capacités améliorées qui promettent de redéfinir notre interaction avec les machines. La démonstration est vraiment impressionnante et n’est pas loin de ridiculiser nos assistants vocaux. Le retard d’Alexa, Google Assistant et Siri en devient même préoccupant…

Avec GPT-4o, l’assistant d’OpenAI devient redoutable

Alors que les rumeurs sur l’arrivée imminente de GPT-5 ont émaillé l’actualité de l’intelligence artificielle ces derniers mois, OpenAI a encore surpris tout le monde en présentant son nouveau modèle GPT-4o, une version optimisée de GPT-4.

« Nous sommes vraiment ravis d’apporter GPT-4o à tous nos utilisateurs gratuitement. Les utilisateurs payants continueront à bénéficier de limites en termes d’utilisation cinq fois plus élevées que les utilisateurs gratuits », a déclaré Mira Murati, directrice technologique de la start-up californienne.

Avec un « o » comme « omni » (du latin omnis qui signifie « tout », ndlr), OpenAI souhaite signifier la polyvalence de son outil qui devient multimodal. Autrement dit, avec son nouveau modèle GPT-4o, le chatbot peut s’appuyer sur divers supports tels que le texte, l’image, le son et la vidéo. Des formats que ChatGPT est également en mesure de produire en temps réel…

« OpenAI continue de repousser les limites de l’intelligence artificielle »

ChatGPT ridiculise Alexa, Google Assistant et Siri

Grâce à GPT-4o, le chatbot d’OpenAI se rapproche furieusement de nos assistants vocaux Alexa, Google Assistant, ou encore Siri. Faut-il y voir un danger pour eux ? La réponse est oui, car il offre une interactivité et une quantité de connaissances sans commune mesure. A la rédaction, nous sommes vraiment impressionnés et dans l’attente d’une réponse des GAFAM !

En effet, comme vous pourrez le constater dans la vidéo ci-dessous, ChatGPT peut désormais tenir des conversations fluides, dépassant le simple format de question-réponse. La startup californienne propose même un « mode vision » tout à fait remarquable, qui permet à l’IA de commenter des flux vidéo en temps réel et même de faire de l’humour. Il en résulte une interactivité sans précédent, qui n’est pas sans nous rappeler la démonstration faite par Amazon en septembre dernier de son nouveau grand modèle de langage (LLM) nommé Alexa AI.

Reste que le LLM d’Amazon n’est toujours pas disponible, alors que ChatGPT-4o est disponible pour tous depuis aujourd’hui. Même constat chez Google où l’Assistant semble végéter, alors même que Gemini n’a pas à rougir face à ses concurrents. Du côté d’Apple, cependant, la solution pourrait bien être un accord avec OpenAI pour intégrer ChatGPT à iOS 18 et se laisser le temps de développer sa propre IA.

Quoi qu’il en soit, avec cette nouvelle version, OpenAI continue de repousser les limites de l’intelligence artificielle, ouvrant la voie à des applications toujours plus sophistiquées et intégrées dans notre quotidien. La concurrence s’annonce féroce dans le domaine des assistants virtuels, et il sera passionnant de voir comment les géants de la tech réagiront à ces nouvelles innovations. D’autant que les déclarations de la startup la plus en vue du moment laissent entrevoir d’autres innovations majeures, annoncées pour le mois prochain, avec pour slogan « The Next Big Thing ». Et si cette prochaine grande chose était une enceinte connectée ?

 

Fasciné par Alexa depuis le jour où je l'ai reçue en bêta test, je me suis peu à peu passionné pour le sujet, avant de me décider à aller plus loin en créant un site avec Jean-Christophe. Une activité qui me permet d'étancher ma soif de nouvelles technologies et de partager mes découvertes sur la plus sympathique des communautés : Les Alexiens.