En peu de temps qu’elle existe, OpenAI a réussi à se tailler une place dans le secteur technologique concurrentiel, grâce à ChatGPT et à ses grandes avancées en matière d’IA générative ; Mais il n’en est pas moins vrai que, depuis le lancement de ChatGPT, l’organisation n’a plus porté un tel coup. En fait, ses concurrents rattrapent leurs modèles linguistiques, comme Google avec Gemini.
Le pire, c’est qu’OpenAI ne tient pas les promesses qu’il fait ; Son PDG, Sam Altman, a la réputation de promettre une révolution toutes les quelques semaines sans vraiment voir de changements notables dans ses produits. Un bon exemple de l’une de ces « révolutions » serait la nouvelle mode vocal avancé avec vision pour ChatGPTqui a été présenté il y a sept mois mais qui n’a montré aucun signe de vie depuis.
Cela se termine aujourd’hui, avec le lancement du « Mode vocal avancé avec vision » ; mais ce n’est même pas une version complète, puisque Il ne sera pas encore disponible en Espagne ni le reste de l’Union européenne, et les utilisateurs de ChatGPT Enterprise devront attendre janvier pour l’essayer.
Malgré cette version limitée, OpenAI a encore une fois déclaré que ce nouveau mode pouvait complètement changer la façon dont nous utilisons ChatGPT et l’IA en général. La clé de ce nouveau mode est qu’il permet des conversations naturelles avec l’IA en utilisant à la fois la voix et la vue.
Dans la démonstration diffusée par OpenAI sur sa chaîne YouTube officielle, on montre comment l’IA est capable de comprendre jusqu’à 50 langues et de participer à des conversations avec plusieurs personnes en même temps dans leur propre langue, en les identifiant à l’aide du caméra frontale du mobile.
Le nouveau mode ChatGPT est capable de utiliser la caméra mobile pour obtenir une vidéo, à la fois de votre interlocuteur et des objets qui l’entourent. Lors de la démonstration, l’IA a commenté que le présentateur avait un chapeau de Père Noël sans qu’il ait besoin de dire quoi que ce soit, et a également compris qu’il voulait faire du café après avoir vu, à travers la caméra, que tout était prêt. L’IA a ensuite exécuté un tutoriel sur la façon de préparer du café.
Manuel Ramírez
L’Android gratuit
En Espagne, le mode vocal avancé de ChatGPT est disponible depuis octobre dernier ; Ce mode est similaire, mais ajoute la possibilité d’utiliser la caméra mobile pour ajouter plus de contexte à nos doutes. De cette façon, il semble qu’OpenAI et Google vont dans la même direction, puisque hier encore Google a présenté ses avancées avec le Projet Astra, une nouvelle IA conçue pour les téléphones mobiles et les lunettes intelligentes, capable d’utiliser des caméras pour offrir de l’aide dans tous les types de situations.