D'une manière pour le moteur de recherche à Gemini en tant que nouvel assistant universel

Table des matières

Google a frappé la table. La Mountain View Company a célébré son événement de développeur annuel, Google E / S, où elle a présenté un flot de nouveautés qui marquera l'avenir de l'entreprise, le tout sous le même dénominateur commun: l'intelligence artificielle. Si il y a une semaine, il avait démontré comment l'IA serait intégrée dans ses appareils Android, maintenant Les Gémeaux s'étendent pour créer un assistant universel de l'IA.

L'ambition de Google est claire: si jusqu'à présent, il a été synonyme de répondre à ce que l'utilisateur devait trouver, maintenant il veut aller plus loin capable de traiter les demandes plus complexespersonnalisé et intégré à l'utilisateur de jour à jour. Il le fait avec des fonctionnalités qui comprennent le contexte de l'utilisateur, qui l'entoure, suit la conversation, correspond aux besoins au-delà des demandes et pour cela, il est en mesure d'utiliser son plein potentiel.

Le point de départ est l'amélioration de Gemini, avec des progrès dans les versions 2.5 Flash et Pro, ainsi que d'introduire une réflexion profonde avec un plus grand raisonnement dans les tâches mathématiques et de code. Cependant, parmi les grandes nouveau-nouveautés qui permettront l'intégration de l'IA dans la vie quotidienne de l'utilisateur est un changement Le moteur de recherche qui intègre un nouveau mode IA —Les aperçus bien au-delà de l'IA. Améliorations dans la personnalisation des réponses, la traduction automatique audio sur Google Meet, la surveillance des produits et les achats sur le Web, améliore la création d'images et de vidéos – maintenant avec son – ainsi qu'un nouveau regard sur Android XR, qui emmène les Gemini aux lunettes et les casques de réalité augmentée.

“Il y a plus d'intelligence disponible, pour tous, partout. Et le monde répond, adoptant l'IA le plus rapide que jamais … Tout ce progrès signifie que nous sommes dans une nouvelle phase de transition de la plate-forme d'IA. Des décennies de recherche sont réalisées pour les personnes, les entreprises et les communautés du monde entier “a expliqué Losco Pichai, PDG de Google et Alphabet sur scène.

Gémeaux en tant qu'assistant universel

L'ambition de Google avec Gemini est d'accompagner l'utilisateur au quotidien. Partout, en tout temps. C'est ce partenaire pour faire confiance à tout ce dont nous avons besoin. “Nous construisons un plus personnel, proactif et puissant, Cela enrichit nos vies, accélère les progrès scientifiques et marque le début d'une nouvelle ère dorée de découverte et d'étonnement “, a expliqué Demis Hassabis, PDG de Google Deepmind.

Hassabis commente qu'ils ont travaillé pour améliorer et étendre leur meilleur modèle de base multimodal, Gemini 2.5 Pro, pour en faire un “modèle mondial”une IA qui est capable de faire des plans et d'imaginer de nouvelles expériences à travers la compréhension et la simulation des aspects du monde, “comme le fait le cerveau”.

Demis Hassabis, PDG de Google Deepmind

Chema Flores

L'androïde gratuit

La capacité des Gémeaux à utiliser les connaissances du monde et raisonnement pour représenter et simuler des environnements naturels, Il peut être utilisé en générant des photographies et des vidéos à intégrer dans les robots, mais sera particulièrement utile dans Project Astra, le projet qui marquera une nouvelle ère dans les lunettes intelligentes. Ici, la compréhension vidéo, l'écran partagé et la mémoire sont essentielles.

L'arrivée de Gemini Live a servi Google à améliorer et à explorer les innovations qui permettent à son IA de se rapporter à l'environnement, ils ont donc ajouté des voix et une conversation plus naturelle et fluide. L'idée est que l'application de Gemini devient un assistant universel de l'IA qui effectuera des tâches quotidiennes pour nous, sera en charge des tâches administratives de routine, présentera des recommandations, plus productif et enrichissant l'expérience.

Ici, Project Mariner devient une importance particulière, un prototype de recherche qui explore l'avenir de l'interaction humaine-agent, en commençant par les navigateurs. Il s'agit d'un test pilote aux États-Unis avec un système d'agents virtuels qui peut effectuer jusqu'à dix tâches différentes en même temps. Ces agents peuvent aider Pour rechercher des informations, faites des réservations, achetez ou enquêter en même temps.

Un nouveau moteur de recherche: il s'agit en mode

Mais s'il existe un service Google emblématique qui changera avec l'arrivée de l'IA ESA est la recherche, son moteur de recherche. Alors que Chatgpt s'est avéré ne pas pouvoir doubler le bras de Google, le Grand g a présenté un plan ambitieux pour transformer complètement l'expérience de Trouvez des informations dans la recherche.

Google explique que depuis le lancement des aperçus de l'IA, il y a eu un changement dans les demandes des utilisateurs “Posez plus de questions, y compris des questions plus complexes, longues et multimodales”ce qui a conduit à 10% de l'utilisation de Google. Maintenant, ils vont plus loin et ont lancé le mode IA, qui atteindra d'abord les États-Unis.

Le mode AI est un nouveau système de recherche que Gemini utilise avec un raisonnement plus avancé, multimodal et puissant pour approfondir les questions de surveillance et les liens vers le Web. Utilisez votre technique de ramification de requête, brisant votre question dans les sous-thèmes et émettant une multitude de consultations simultanément sur le nom de l'utilisateur. “Cela permet La recherche est plus sur le Web qu'une recherche traditionnelle sur Googlevous aidant à découvrir encore plus que le Web à offrir et à trouver un contenu incroyable et hyperrelier qui correspond à votre question “, explique Liz Reid, responsable de Google Search.

Présentation du mode AI du moteur de recherche Google.

Présentation du mode AI du moteur de recherche Google.

Chema Flores

L'androïde gratuit

Parmi les nouveautés de la recherche, il y aura la capacité d'effectuer des recherches approfondies pour des recherches, consulter des centaines de recherches en même temps et analyser les résultats en temps réel pour le combiner dans une réponse – avec accès aux sources. Ils peuvent aussi faire Real -Time Recherches avec Search Live, Un système similaire à Gemini Live, mais cela rendra l'expérience utilisateur plus fluide car vous pouvez utiliser l'appareil photo de votre smartphone.

Il sera également centré sur les achats. Nous pouvons demander au moteur de recherche “acheter deux billets pour le concert de cet après-midi”, il cherchera quelles sont les meilleures options et les montrent à l'utilisateur. Il le fera de manière plus profonde grâce à l'alliance avec des sociétés telles que Ticketmaster, StubHub, Resy ou Vagaro. De plus, la recherche intègre une surveillance des produits des produits, de sorte que si nous sommes intéressés par un sac, il pourra nous avertir quand il sera à son prix minimum et Achetez-le directement avec une touche grâce à Google Pay.

L'une des nouveautés des achats est l'utilisation de l'intelligence artificielle pour Essayez-nous Vêtements virtuellement, qui sert à avoir une idée de la façon dont ce pantalon qui nous intéresse dans une boutique en ligne peut être laissé. Il suffira de prendre une photo pour que l'utilisateur sache Comment ce vêtement peut être dans votre corps.

Android XR, révolution «portable»

Dans Google, ils travaillent sur le concept de lunettes intelligentes depuis plus d'une décennie et c'est maintenant avec Android XR lorsqu'ils ont fait un grand pas en avant. Après l'annonce de son alliance l'année dernière avec Samsung dans son casque qui rivalisera avec Vision Pro, Google va plus loin et a annoncé un accord avec Gentle Monster et Warby Parker, pour Créez des lunettes avec Android XR. Et l'entreprise est claire: “Les lunettes ne sont vraiment utiles que si vous voulez les porter toute la journée.”

Ces lunettes sont équipées de caméras, de microphones et de haut-parleurs et fonctionnent avec votre téléphone, vous permettant d'accéder à vos applications sans avoir à rechercher dans votre poche. De plus, un écran facultatif dans l'objectif fournit des informations utiles en privé juste au moment où vous en avez besoin. “Au Combinez ces lunettes avec des Gémeaux, Venez écouter ce que vous faites, afin qu'ils comprennent votre contexte, rappelez-vous ce qui est important pour vous et vous fournissez des informations juste au moment où vous en avez besoin. “C'est une attaque directe sur la ligne d'arrivée.

Bien qu'il n'y ait toujours pas de date de son arrivée, l'avance d'aujourd'hui a montré comment les lunettes Android XR fonctionneront dans des situations réelles, y compris l'envoi de messages à des amis, organiser des rendez-vous, demander des indications étape par étape, prendre des photos et plus encore. Nous avons même fait une démonstration de traduction en direct entre deux personnes, montrant le potentiel de ces lunettes pour briser les barrières linguistiques ou offrir des sous-titres pour le monde réel. Pour le moment, nous devrons attendre quelques mois pour les voir terminés.

Flux, plus de créativité

Parmi les améliorations des Gémeaux figurent les progrès de la génération d'images et Vidéos avec flux, Un modèle génératif d'aspiration vidéo fait pour voir 3, améliorant ainsi son réalisme et sa dynamique des fluides, qui en ont fait une référence du secteur. Maintenant, il intègre également le son, ce qui rend l'expérience totale.

La grâce de Flow est que le créateur peut utiliser ses propres ressources pour créer des caractères ou utiliser Flow pour créer vos propres images avec les fonctions texte dans l'image d'image. Une fois un sujet ou une scène créé, Ils peuvent être intégrés dans différents clips et scènes de manière cohérente. Ou vous pouvez utiliser l'image d'une scène pour commencer une nouvelle photo.

Parmi les fonctions qui alimentent ce nouveau récit, il y a une gamme de fonctions pour les professionnels ou les débutants; Contrôle de la chambre, pouvoir demander le mouvement au mouvement, Les angles et les perspectives de la caméra; Créer des scènes et étendre les photos existantes en temps réel; gérer les indications beaucoup plus facilement; ainsi que Flow TV, où l'utilisateur peut être inspiré par une sélection en croissance constante des clips, des chaînes et du contenu générés avec VI.

Pour utiliser le flux avec voir 3 sera nécessaire Avoir Google Ai Ultra, qui coûtera 249,99 $ par mois et comprend également l'application Gemini avec 2,5 Pro Deep Think et I Voir 3, Whisk, Noteboollm avec les limites les plus élevées, Gemini en Gmail, Docs and Videos, Gemini in Chrome, Project Mariner, YouTube Premium et 30 TB de stockage.

Google Beam: appels vidéo royaux et fluides

Après l'avoir présenté il y a quelques années, Google n'oublie pas le projet Starline, sa solution pour effectuer des appels vidéo approchant de la télépression. Appelé comme Google Beamcette plate-forme utilisera l'IA pour permettre “une nouvelle génération d'appareils qui aident les gens à établir des connexions importantes, quel que soit leur lieu”.

Google Beam

Google Beam

Google

L'androïde gratuit

La grâce de ce système est l'utilisation d'une vidéo volumétrique qui transforme les transmissions vidéo 2D en expériences 3D réalistes, ce qui permet de se connecter plus naturellement et intuitivement. “La combinaison de notre modèle vidéo AI et de notre écran de terrain léger Créer un sensation de dimensionnalité et de profondeur. Cela permet d'établir un contact visuel, d'interpréter des signaux subtils et de générer une compréhension et une confiance comme s'ils étaient en face à face. “Pour le développement de ces appareils, ils travaillent en collaboration avec HP pour lancer les premiers appareils Google Beam sur le marché avec des clients sélectionnés à la fin de cette année.

Cette solution n'est pas destinée à la maison, mais aux bureaux et aux environnements de travail. Même ainsi, Google a incorporé l'une des fonctions qui arriveront également dans le faisceau dans Google Meet; La traduction simultanée en appels vidéo. Au début, il sera espagnol-anglais et permettra de maintenir des conversations traduites authentiques, presque en temps réel, en gardant la voix, le ton et les expressions. “C'est la première étape d'une vision plus large pour voir et comprendre parfaitement quiconque dans le monde”, explique l'entreprise.

Leave a Reply