Si Chatgpt nous a surpris par les images générées par le style Ghibli en mai, maintenant Qwen-Image fait un pas géant En obtenant un modèle des images de génération avec du texte intégré.
Derrière «l'équipe Qwen» se trouve Alibaba, le géant des achats en ligne, qui obtient suffisamment de ressources pour atteindre des jalons tels que QWEN-IMAGE et localiser ainsi ce modèle d'IA dans une position très spéciale contre d'autres.
Et non seulement parce qu'il est open source, comme les deux nouveaux modèles de raisonnement openai il y a des heures, mais parce qu'il est Capable de rendre du texte en anglais et en chinois Dans les images générées à partir d'un Rapide du texte.
Dans une zone où les rivaux souffrent simplement, Qwen-Image ouvre une nouvelle ère de génération d'images, non seulement parce que nous pouvons mettre un sandwich au texte à une illustration de manga, mais parce qu'il ouvre la porte à Toutes sortes d'illustrations avec des guides expliquant du texte, des tutoriels Et plus.
En admettant tellement Écrits d'alphabétisation comme logographiquesc'est un modèle qualifié pour gérer toutes sortes de polices de caractères complexes, des conceptions de lignes multiples, une sémantique au niveau du paragraphe et du contenu bilingue.
Ce qui nous amène à un modèle qui se distingue par sa capacité à générer Affiches de films, diapositives de présentations, fenêtres de la boutique et même des infographies stylisées et descriptives.
Ainsi, nous pouvons créer une illustration dans laquelle les différents exercices de résistance sont représentés visuellement et décrits dans le texte ou faire une présentation d'une conception, des matériaux pour une classe ou tous les types de contenu créatif.

Image générée avec un studio de texte intégré Ghibli
Vous pouvez accéder au modèle QWEN-IMAGE depuis Votre site Web et sélectionnez “Génération d'images” dans les boutons trouvés sous le champ de texte. L'invite est créée et le texte est introduit en citations pour générer l'image.
Surtout est une étape importante car c'est un Modèle ouvert sans limitescontrairement à MidJourney qui vous permet d'incorporer du texte, mais il a des limites dans son utilisation.

Illustration descriptive avec texte fabriqué par Gwen-Image
Le seul détail à garder à l'esprit est que le Invite Ils doivent être plus descriptifs Devoir introduire le texte qui doit apparaître dans chacun des rendu comme dans cet exemple: “Au Vary Center, le titre “Habits for Emotional Wellbeing” apparaît clairement, à déclenchement par un modèle floral symétrique “.
En plus de générer des images avec du texte, Qwen-Image offre des performances exceptionnelles dans Image Edition en préservant à la fois le sens sémantique et le réalisme visuel.

Soutenir plusieurs opérations Parmi lesquels comprend le transfert de style, l'addition, la suppression, l'amélioration des détails, l'édition de texte et même la possibilité d'ajuster la pose des caractères qui apparaissent dans l'image générée.
À partir de son site Web, vous pouvez voir comment il est capable de capturer le style d'anime de Miyazaki (Studio Ghibli) et de créer toutes sortes d'images avec du texte. Un autre des exemples qu'il donne est celui de la bibliothèque d'une librairie avec divers livres et ses titres avec ses couvertures.

Performances de Gwen-Image par rapport à d'autres modèles
Qwen-Image, comme vous pouvez lire à partir de l'annonce dans Votre site Webest distribué sous la licence Apache 2.0 pour l'utilisation, la redistribution et la modification commerciales et non commerciales, bien que l'attribution et l'inclusion du texte de la licence pour les travaux dérivés soient nécessaires.
