Depuis la création de vidéo avec une musique de résumé audio dans les documents

Table des matières

Google a changé pour toujours. L'entreprise est déjà à 100% axée sur l'IA, pour le meilleur ou pour le pire, et cela est remarqué dans absolument tous ses services et applications; C'est un pari que, pour le moment, réussit, en particulier avec les Gémeaux, le rival de Chatgpt.

Mais l'engagement de Google envers l'IA va bien au-delà des services destinés à l'utilisateur final, et aujourd'hui nous avons eu une bonne démonstration de cela avec le Google Cloud 25 prochainl'événement s'est concentré sur la plate-forme Google Cloud qui, dans cette édition, a complètement adopté l'IA dans toutes ses branches et capacités.

Sans surprise, Google suppose que Google Cloud est la seule plate-forme optimisée pour l'IAqui nous permet d'utiliser toutes sortes de modèles, à la fois ceux de Google lui-même et des modèles ouverts et de Mistral Call via la plate-forme de développeur Vertex AI. Mais bien sûr, l'adoption de Gemini, maintenant dans sa version 2.5, est le principal protagoniste des nouveautés, car c'est le modèle qui permet de concevoir les applications, pour assister au développement du code source et générer des tests automatiques.

Les agents sont la nouvelle tendance dans le secteur, et comment pourrait-il être autrement, Vertex AI ajoute de nouvelles façons de gérer les écosystèmes multi-agents. N'oubliez pas que les agents sont systèmes autonomes qui peuvent effectuer des actions sans intervention humaine; Par exemple, pour automatiser les tâches habituelles. La grande nouveauté est le nouveau protocole A2A (Agent2Agent), qui permet une communication sûre entre plusieurs agents via différentes plateformes.

Vertex AI sert non seulement au développement d'applications et à la création d'agents, mais il est également devenu la seule plate-forme avec des modèles de génération multimédia capables de créer des vidéos, des images, de la voix et de la musique. Pour ce faire, Vertex Ai soutient maintenant le texte Lyria à la musique, qui Il permet de générer des chansons et des thèmes musicaux en fonction des suggestions d'utilisateurs; De plus, j'adopte que je vois 2 pour la vidéo, le chirp 3 pour la reconnaissance vocale dans plus de 100 langues et l'image 3 pour la génération d'images.

Google a démontré ces capacités créant une vidéo sur un concert, dans laquelle tous les éléments ont été générés par l'IA, y compris la musique de fond. La chose intéressante est que ces modèles sont capables de Modifier les éléments au goût de l'utilisateur. Par exemple, si dans l'une des vidéos générées une personne en arrière-plan apparaît, nous pouvons indiquer à l'IA qui l'élimine et générer une nouvelle vidéo, identique à la précédente, mais sans cet élément concrète, quelque chose qui jusqu'à présent était très difficile car quiconque a créé des images ou des vidéos pour IA le sait; En raison de la nature de l'IA générative, ils génèrent un résultat différent à chaque occasion, mais les modèles Google permettent de travailler avec un niveau de précision plus élevé. Google suppose que Vertex AI est la seule plate-forme qui propose des modèles de génération multimédia via toutes les modalités, ce qui vous permet de créer des productions complètes à partir du texte.

Google Workspace, la suite de bureaux de la société, a également reçu de nouvelles fonctions basées sur l'IA, y compris Fonctions audio sur Google Docs; Il est inspiré par le grand succès que Notebooklm a eu, l'une des applications basées sur Google les plus populaires grâce à sa fonction qui vous permet de créer des podcasts audio basés sur des documents texte.

De même, les utilisateurs de Google Workspace peuvent Créer des versions audio de vos documentsou générer des podcasts qui résument le contenu et se concentrent sur les sections les plus importantes. Google le définit comme “une nouvelle façon d'interagir avec le contenu” et sera disponible en alpha tout au long de ce trimestre.

Ces fonctions et d'autres sont possibles grâce à Dernière grande avancée de Google Hardware: Ironwooddéfini comme le premier TPU (unité de traitement du tendeur) de Google pour l'ère de l'inférence. C'est l'accélérateur le plus puissant et le plus évolutif de Google à ce jour, et représente un changement “significatif” dans le développement de l'IA et de l'infrastructure dont cela dépend. Au lieu de se concentrer sur des modèles “réactifs” qui offrent des informations réelles, l'engagement envers des modèles “proactifs” tels que les agents d'IA, qui obtiennent et générent des données par eux-mêmes pour offrir des perspectives et des réponses, pas seulement des données.

Leave a Reply