Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Sommaire
Google DeepMind vient de faire une annonce fracassante : le lancement de Gemma 2, un modèle text-to-text ouvert et léger, comprenant 2 milliards de paramètres. Ce modèle fait suite au succès du premier modèle Gemma AI sorti plus tôt cette année. Cette nouvelle itération utilise une méthode de distillation pour apprendre de modèles plus volumineux et, selon les experts de DeepMind, elle affiche des résultats impressionnants qui surpassent même les modèles GPT-3.5.
Gemma 2 est conçue pour être une solution flexible et performante, capable de fonctionner sur une variété de matériels. Qu’il s’agisse de simples ordinateurs portables, de dispositifs en périphérie ou de déploiements dans le cloud via Google Kubernetes Engine, Gemma 2 se montre à la hauteur des attentes. Cette polyvalence technologique rend son accès et son utilisation particulièrement aisés pour un large éventail d’utilisateurs et de chercheurs.
L’un des aspects les plus remarquables de Gemma 2 réside dans ses différentes tailles : avec des versions possédant 9 milliards et 27 milliards de paramètres, elle offre des capacités adaptées à divers besoins et configurations. Par cette variété, DeepMind montre qu’il est possible d’allier puissance et flexibilité, rendant l’intelligence artificielle plus accessible et plus performante.
Avec la méthode de distillation, Gemma 2 apprend de modèles plus grands pour offrir des résultats de haute précision sans les lourdeurs des modèles d’origine. Cette technique permet non seulement d’optimiser la consommation de ressources, mais aussi d’obtenir des performances qui surpassent les attentes. Une telle innovation est cruciale, surtout dans un contexte où l’efficacité énergétique et l’accessibilité des technologies de pointe deviennent des priorités.
En plus de Gemma 2, DeepMind a introduit deux nouveaux membres à la famille Gemma : ShieldGemma et Gemma Scope. Ces outils sont orientés vers des objectifs précis et essentiels : la détection des contenus nuisibles et l’amélioration de la transparence.
ShieldGemma se présente comme un ensemble de classificateurs de sécurité destinés à modérer les contenus nuisibles dans les entrées et sorties des modèles d’IA. Sa mission est de cibler les discours haineux, le harcèlement, les contenus sexuellement explicites ou encore les matériels dangereux. Cette initiative est cruciale dans un monde où l’IA est de plus en plus impliquée dans la gestion des informations et des interactions en ligne.
Par ailleurs, Gemma Scope utilise des autoencodeurs clairsemés pour offrir une compréhension plus limpide des processus et des décisions des modèles Gemma 2. Avec plus de 400 SAEs (Sparse AutoEncoders) disponibles gratuitement et couvrant toutes les couches des modèles, cette transparence accrue permet aux développeurs et chercheurs de mieux appréhender les dynamiques internes de l’IA. Comprendre comment une IA arrive à certaines conclusions peut être déterminant pour l’amélioration continue des algorithmes et pour garantir une utilisation éthique et justifiable.
Les enthousiastes de l’IA peuvent accéder à Gemma 2 via plusieurs plateformes populaires telles que Kaggle, Hugging Face, et Vertex AI Model Garden. Il est également possible de l’essayer sur Google AI Studio. Quant à ShieldGemma et Gemma Scope, ils sont également disponibles et prêts à l’emploi pour ceux qui souhaitent explorer davantage ces nouvelles fonctionnalités.
L’approche globale de DeepMind avec Gemma 2, ShieldGemma et Gemma Scope met en évidence leur engagement à non seulement pousser les limites de l’innovation technologique, mais aussi à garantir que cette technologie reste sûre, transparente et accessible à tous.