Le lancement de ChatGPT a été un coup d’eau froide pour Google, qui investissait depuis des années dans l’intelligence artificielle, mais OpenAI l’a devancé avec un produit très populaire auprès du grand public. Depuis, le grand G a tenté de rattraper son retard, et un an plus tard, on peut déjà dire qu’il a rattrapé son rival avec Google Gemini, au moins sur certains aspects.
Le développement de l’IA au sein de Google s’est accéléré à des niveaux jamais vus auparavant, et pour preuve, la présentation aujourd’hui de Gemini 1.5, une nouvelle version quelques jours seulement après avoir rendu Gemini 1.0 accessible à tous. Ces jours-ci, Gemini a même eu le temps d’atteindre Android et en espagnol, un rythme brutal de lancements que nous n’avions pas vu même dans les meilleurs moments de Google.
Comme l’indique le « .5 », cette nouvelle version de Gemini n’est pas un renouvellement complet de l’IA générative, mais c’est une amélioration substantielle sur un aspect fondamental : performances et efficacité. En d’autres termes, faire plus en moins de temps et à moindre coût, ce qui ouvre la porte à d’autres améliorations telles que la quantité d’informations que l’IA est capable de traiter en même temps et la rapidité avec laquelle elle peut être entraînée à différentes tâches.
Gemini 1.5 est là
Google affirme même que Gemini 1.5 possède un 1 million de jetons de manière constante; À titre de comparaison, Gemini 1.0 Pro n’était «que» capable de traiter 32 000 jetons, et GPT4 Turbo, la dernière version du modèle sur lequel est basé ChatGPT, peut traiter 128 000 jetons. Les jetons sont des blocs utilisés pour traiter des informations et peuvent être des parties ou des sous-sections de mots, d’images, de vidéos, de sons et de codes ; Plus la « fenêtre » de contexte est grande, plus elle peut obtenir et traiter d’informations après une demande de l’utilisateur.
Tout cela signifie que l’IA de Google est capable de capter plus d’informations à la fois, grâce à un nouvelle architecture basé sur la technique « Mixture-of-experts » (MoE), qui vous permet de sélectionner les parties les plus pertinentes de votre réseau neuronal en fonction du type de données saisies ; Et il s’agit toujours d’une IA multimodale, elle prend donc en charge non seulement le texte, mais aussi la vidéo.
Performances du Gemini 1.5 Pro par rapport à son prédécesseur et ses rivaux
Tout cela suppose que le Gemini 1.5 Pro soit capable de traiter une heure de vidéo, 11 heures d’audio, plus de 30 000 lignes de code source, soit plus de 700 000 mots sans problème. Cependant, Google avoue également que 128 000 tokens seront utilisés en standard, et que seul un groupe limité de développeurs pourra le tester avec 1 million de tokens dans AI Studio et Vertex AI.
Traiter une plus grande quantité d’informations présente un avantage évident dans une IA générative, car cela permet d’obtenir un plus grand contexte et de présenter un résultat plus cohérent, pertinent et utile pour l’utilisateur final. C’est peut-être ce dont Gemini avait besoin pour rattraper ChatGPT et le surpasser, quelque chose que nous remarquerons dans l’application Android officielle ainsi que dans les applications et services qui utilisent Gemini.
Cela peut vous intéresser
Suivez les sujets qui vous intéressent