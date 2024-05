Ce nouveau modèle d'IA générative peut "raisonner" en temps réel via l'audio, la vision et le texte. Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, en commençant par le texte et l'image.

La révolution de l'IA se poursuit. OpenAI, l'éditeur de ChatGPT, a présenté lundi 13 mai son nouveau modèle d'intelligence artificielle générative, GPT-4o, censé apporter à tous ses utilisateurs ses capacités les plus avancées en production et compréhension de texte, d'images et de sons et voix. "Nous sommes vraiment ravis d'apporter GPT-4o à tous nos utilisateurs gratuits. Les utilisateurs payants continueront à bénéficier de limites en termes d'utilisation cinq fois plus élevées que les utilisateurs gratuits", a déclaré Mira Murati, directrice technologique de la start-up californienne, lors d'une présentation vidéo diffusée en direct.

"Mais c'est la première fois que nous faisons un grand pas en avant en matière de facilité d'utilisation. C'est extrêmement important, il s'agit de l'avenir de l'interaction entre nous et les machines", a-t-elle ajouté. OpenAI a dévoilé un nouveau modèle, GPT-4o ("o" pour "omni"), qui peut "raisonner" en temps réel via l'audio, la vision et le texte. Ces nouvelles capacités vont être progressivement ajoutées à ChatGPT, en commençant par le texte et l'image, d'abord pour les abonnés payants, ainsi que les utilisateurs gratuits, avec des limites en matière d'usage. La nouvelle version du "Voice Mode" (mode vocal) doit arriver dans les prochaines semaines pour les abonnés.

1/ OpenAI introduces 'GPT-4 Omni', enhancing its AI model to support voice, text, and vision, available to all users including free accounts. pic.twitter.com/GyP7Qsd0tK — Barsee 🐶 (@heyBarsee) May 13, 2024

Avec deux de ses collègues, Mira Murati a démontré comment les utilisateurs vont pouvoir interagir avec ChatGPT, lors de conversations fluides, reproduisant de façon bluffante des discussions entre humains. En mode vocal, ChatGPT est capable de lire les émotions des utilisateurs sur les visages via la caméra d'un smartphone, de les guider pour faire des exercices de respiration, de leur raconter une histoire ou encore de les aider à résoudre un problème mathématique. Et les utilisateurs peuvent facilement l'interrompre.

"Tu as l'air joyeux. (...) Tu veux me dire quelle est la source de toute cette bonne humeur ?", a ainsi demandé la machine à un ingénieur d'OpenAI, qui lui a répondu être en train de montrer au public à quel point elle est "utile et fabuleuse". "Oh arrête, tu me fais rougir", s'est-elle exclamée en retour. Fin 2022, avec le lancement de ChatGPT, OpenAI a mis sur les rails l'IA générative, une révolution qui a pris de court tous les géants technologiques.