Modifiez les photos avec la voix ou le texte avec cette impressionnante intelligence artificielle gratuite de Google

Table des matières

Le Google pari pour l'intelligence artificielle C'est énorme. Pas dans la technologie vaine Transformateur, qui est l'essence de l'IA générative, quitté ses laboratoires. Nous constatons actuellement une très forte intégration dans Android, car Sameer Samat, président de l'écosystème Android dans Google, a déclaré dans une interview avec The Spanish – Omicrono.

Nous avons passé un peu de temps pour utiliser des chatbots tels que le chatppt dans des applications de bureau auxquelles Gemini fonctionne comme le successeur de l'assistant Google ou que Samsung positionne Galaxy Ai comme le plus grand élément différentiel de ses nouveaux smartphones. Et avec succès.

La révolution est non seulement rapide, mais constante. Et des entreprises comme Google continuent d'innover, bien que Les fonctions les plus frappantes sont précédemment testées dans des environnements de développement contrôlés Et puis légué aux applications et aux mobiles. Un bon exemple est Google AI Studioune plate-forme conçue pour commencer à compiler avec Gemini, la famille de nouvelles génération de modèles génératifs multimodaux de la filiale de l'alphabet.

Édition avec la voix

Dans cette plate-forme Web, le test de l'entreprise différents modèles d'IA qui se spécialisent dans différentes choses. L'un des derniers qui a mis à la disposition des utilisateurs et des développeurs est Gemini 2.0 Flash (génération d'images) expérimentalcentré sur l'édition et la génération d'images. Ce modèle est capable de changer les choses d'une image que nous téléchargeons simplement en écrivant ou en dictant ce que nous voulons.

À la fois dans les ordinateurs et les mobiles Nous pouvons utiliser la dictée vocale pour créer des demandes complexes. Comme vous pouvez le voir, avec des phrases simples, il est déjà possible de changer les éléments d'une image, comme si nous contrôlions Photoshop à distance et le programme a fait ce que nous demandons.

Essieu contrôlé par texte

L'androïde gratuit

Dans cette première image, par exemple, nous avons changé la couleur du maillot de l'une des personnes, et nous l'avons fait correctement et extrêmement rapide, car l'exécution de la commande a conduit Entre 5 et 10 secondes. Bien sûr, cela ne fonctionne pas toujours bien.

Par exemple, la deuxième commande lui a dit de mettre des lunettes de soleil aux deux personnes. Il a compris ce que nous voulions, mais pas que nous le voulions chez les deux personnes, donc il ne les a mis à l'homme. Si nous lui demandons de corriger et de les mettre sur la femme, les supprime étrangement de l'autre personne. Nous avons également changé l'arrière-plan.

Exemple de texte contrôlé

Exemple de texte contrôlé

L'androïde gratuit

Cela montre que En tout temps, il travaille avec l'image originale, Puisqu'il n'a aucun échec pour retirer à nouveau les lunettes de la personne et montrer son visage. Bien sûr, nous pouvons continuer à effectuer des itérations sur les modifications en ajoutant de plus en plus.

Le fait est que, Si nous détaillons la pétition beaucoup plusdisant expressément que nous voulons des lunettes rouges dans le cas et du bleu dans le cas, Le système comprend et le fait. Il est clair qu'il s'agit toujours d'un système expérimental, mais l'opération est impressionnante.

Exemple de texte contrôlé

Exemple de texte contrôlé

L'androïde gratuit

En plus de pouvoir changer les couleurs ou certains éléments des images, d'autres peuvent être ajoutés Avec une consistance très forte. Dans le deuxième exemple, nous avons pris une photo de la cathédrale de Majorque et nous lui avons demandé d'ajouter un navire rouge.

Le système a compris ce que nous voulions et l'a créé, mais aussi sait que j'ai également dû créer la réflexion dans l'eauparce que c'est ainsi que cela serait resté sur une vraie photographie. Cela nous donne une idée de la quantité de décisions autonomes que ces modèles peuvent prendre avec une commande simple.

Ajout d'éléments

Ajout d'éléments

L'androïde gratuit

L'interface Google AI Studio n'est pas compliquéemais ce n'est pas aussi simple que celui des Gémeaux. Il montre qu'il est conçu pour un type d'utilisateur plus avancé, en particulier les développeurs, et donne des outils qui permettent de modifier les résultats. Par exemple, nous pouvons extraire le code de programmation, modifier le format modèle ou de sortie.

Il est également possible de voir le nombre de jetons qu'une commande spécifique a utilisés ou de modifier les paramètres de sécurité afin que le système ne lance pas des images violentes ou désagréables. Dans la partie supérieure, nous pouvons même activer le mode de comparaison, ce qui nous permet d'exécuter une commande dans deux modèles à la fois pour voir quelles différences ils montrent.

Interface Google AI Studio

Interface Google AI Studio

L'androïde gratuit

Création d'histoires

Ce modèle AI, Gemini 2.0 Flash (génération d'images), Il a d'autres possibilités en plus de modifier les images. Dans l'interface, ils nous montrent que les cartes d'anniversaire peuvent être créées, par exemple, ou beaucoup plus intéressantes, comme Créez une histoire dans certaines vignettes simplement avec une commande.

Ce que le système fait, c'est créer ses propres commandes pour chaque vignette, en infinant ce qu'elle a à mettre en fonction de la commande d'origine, qui n'a pas à être particulièrement concret ou étendu. Le résultat est une histoire avec des images qui pourraient être utilisées pour raconter un enfant la nuit, par exemple.

Interface Google AI Studio

Interface Google AI Studio

L'androïde gratuit

L'un des exemples que nous avons créés est une histoire sur un fantôme qui veut échapper à l'enfer. Pour enlever un petit fer, les illustrations ont été demandées dans un style d'art de pixels, comme si c'était presque l'histoire d'un jeu des années 80. maintient la cohérence tout au long des créations des différentes vignettes.

Bien que tous ces outils soient entièrement utilisables et gratuits (nous n'avons besoin que d'un compte Google pour utiliser Google AI Studio), Ils deviendront massifs lorsqu'ils seront intégrés dans les systèmes de l'entreprisedans des applications telles que Google Drive ou sur Android via Gemini.

Leave a Reply