Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
Physical Address
304 North Cardinal St.
Dorchester Center, MA 02124
DBRX dépasse les modèles de langage ouverts populaires
Databricks a récemment dévoilé son nouveau
Sommaire
Databricks a récemment dévoilé son nouveau modèle de langage large open-source, baptisé DBRX. Ce dernier bat des options bien établies telles que GPT-3.5 dans les benchmarks de l’industrie. De plus, DBRX surpasse des modèles de langage ouverts populaires tels que LLaMA 2 70B, Mixtral et Grok-1 dans diverses tâches, allant même jusqu’à surclasser des modèles en closed source comme Claude sur certains benchmarks.
L’efficacité remarquable de DBRX est attribuée à son architecture de mélange d’experts, ce qui le rend jusqu’à deux fois plus rapide en inférence que d’autres modèles avec moins de paramètres actifs. DBRX a été pré-formé sur un énorme ensemble de données de 12 billions de tokens, méticuleusement sélectionnés pour en améliorer la qualité. Il utilise par ailleurs des technologies telles que les encodages de position rotatifs et l’apprentissage par programme pendant la préformation.
Les entreprises peuvent interagir avec DBRX via des APIs ou par l’intermédiaire des outils de Databricks pour affiner le modèle sur leurs propres données. Il est déjà en cours d’intégration dans les produits d’intelligence artificielle de Databricks. Plusieurs partenaires tels qu’Accenture, Block, Nasdaq, Prosus, Replit et Zoom ont salué le potentiel de DBRX à accélérer l’adoption des modèles de langage larges ouverts et personnalisés en entreprise.
Les analystes suggèrent que l’introduction de DBRX pourrait entraîner un changement de paradigme en faveur des modèles open source par rapport aux modèles closed source, dans la mesure où les modèles open source affinés peuvent égaler la performance des modèles propriétaires. Le responsable de l’intelligence artificielle et des services de données de Nasdaq a félicité Databricks pour le lancement de DBRX, soulignant la performance exceptionnelle du modèle et les économies considérables que son usage génératif peut apporter.
En conclusion, le lancement de DBRX par Databricks est une avancée majeure dans le domaine des modèles de langage. Son architecture unique, couplée à son entraînement sur un ensemble de données de taille massive, lui confère des performances inégalées dans diverses tâches. Les entreprises peuvent ainsi tirer parti de ce modèle à travers les APIs de Databricks et des outils personnalisables pour améliorer leur efficacité. Tandis que les modèles open source continuent à gagner du terrain, il sera intéressant de suivre l’évolution et l’impact de DBRX sur l’industrie.