En seulement deux ans, le secteur de l'intelligence artificielle est méconnaissable; Il est passé d'une technologie futuriste dont l'utilité était dans le doute, à un produit de masse que toutes les grandes entreprises parient. Et une bonne partie de ce tour a Openai, avec Chatgpt, qui était le «chatbot» qui a démontré le potentiel de l'IA générative.
Depuis lors, les choses ont beaucoup changé. Le nombre de concurrents dans le secteur est très élevé et chaque jour est plus élevé; Et cette augmentation de la concurrence suppose que ce qui était auparavant incroyable ne suffit plus. Chatgpt a en particulier pour cela, avec des rivaux tels que Gemini et Deepseek offrant plus de fonctions et des performances similaires à un prix bas.
La réaction d'Openai n'a pas été attendue, avec d'importants changements internes qui seront remarqués au cours des prochains mois, ce qui signifie prendre des décisions choquantes telles que l'abandon de nouveaux modèles pour se concentrer sur les futurs. Aujourd'hui, Openai a annoncé un autre de ces changements, ce qui simplifie sa gamme de produits et de puissance: le Création d'images par AI.
Bien sûr, Openai avait déjà un modèle de génération d'images, et l'un des plus populaires: nous avons parlé de Dall-E, qui a été l'un des premiers générateurs d'images basées sur l'IA qui ont vraiment démontré le potentiel de cette technologie (pour le meilleur et pour le pire). Cependant, Openai a maintenant décidé de se concentrer sur Chatgpt, qui gagne désormais les fonctions de génération d'images avec le Nouveau 4ème modèle Par défaut, l'abandon de Dall-E 3.
Avec le modèle 4, Chatgpt est capable de générer des images nativement Et sans avoir besoin d'un modèle externe, en plus d'autoriser l'édition d'images avancées. Le nouveau modèle apporte également des améliorations importantes en ce qui concerne Dall-E, et en particulier, résolvez certains de ses plus grands problèmes tels que la génération de texte.
Image générée par Chatgpt
Openai
L'androïde gratuit
Un échec très courant dans les premières images générés par l'IA était dans les textes; Les modèles n'étaient tout simplement pas en mesure de comprendre la façon dont ils devaient insérer les caractères dans l'image. Par conséquent, la grande avancée de 4 est précisément Dans les textes qui apparaissent dans l'imagequi sont maintenant rendus avec précision et suivant les instructions de l'utilisateur à la lettre, selon Openai.

Manuel Ramírez
L'androïde gratuit
De cette façon, il est plus facile de créer l'image que nous voulons vraiment, sans créer une image de base, puis de mettre le texte à l'aide d'un éditeur d'image. Le résultat devrait être Images plus réalistesS, dans lequel le texte est mieux intégré au reste de la scène, et pour le démontrer, Openai a publié des exemples surprenants.
Le nouveau 4ème modèle apporte également une importance importante Améliorations dans la cohérence des personnagesce qui est important si nous voulons créer plusieurs images consécutives. Par exemple, si nous demandons une image d'une femme écrivant, nous pouvons lui demander de faire une image de la même personne et son apparence sera la même, au lieu de créer une autre personne. De la même manière, la génération d'images Shift a également été améliorée, dans laquelle l'utilisateur affine l'image en ajoutant ou en supprimant des éléments à chaque étape.
Le nouveau 4e modèle de Chatgpt est désormais disponible pour tous les utilisateurs, y compris ceux qui ont des comptes gratuits, en plus des comptes de paiement Plus, Pro et Team. L'accès à Dall-E est maintenu, avec un nouveau Dall-E GPT. De plus, le nouveau modèle peut également être utilisé dans Sora, AI pour générer des vidéos.
