Le protocole Coral surpasse Microsoft de 34 % avec le meilleur Benchmark GAIA pour le mini-modèle AI

En bref

Le système multi-agent de Coral Protocol a surpassé Magnetic-UI soutenu par Microsoft de 34 % sur le benchmark GAIA, démontrant que l'orchestration intelligente de modèles plus petits peut rivaliser ou dépasser les approches traditionnelles de l'IA à grande échelle.

Le Protocole Coral Établit un Nouveau Référentiel Pour les Systèmes d'IA Mini-Agent, Dépassant Microsoft de 34 % sur le Test GAIA

Infrastructure décentralisée pour l'IA collaborative, le Coral Protocol a rapporté que son système multi-agents a surpassé Magnetic-UI soutenu par Microsoft de 34 % sur le GAIA Benchmark—un résultat sans précédent qui suggère que l'évolutivité horizontale pourrait offrir une approche plus efficace que l'expansion des paramètres du modèle. Le système du protocole exploite une orchestration intelligente entre plusieurs agents, plutôt que de se concentrer uniquement sur l'augmentation de la taille du modèle.

Cette performance a marqué le score vérifié le plus élevé sur le GAIA Benchmark utilisant des mini agents, soutenant la prémisse de NVIDIA selon laquelle des modèles plus petits bien coordonnés pourraient jouer un rôle clé dans l'avenir de l'IA. Le résultat, selon les développeurs de Coral, reflète un changement conceptuel dans l'approche de la scalabilité de l'IA plutôt qu'une simple augmentation de la puissance du système.

En tant que protocole ouvert, Coral facilite l'expansion des capacités de l'IA en permettant la coordination entre des agents spécialisés à l'échelle mondiale, au lieu de se fier à des modèles généraux centralisés. Son architecture permet une interaction parallèle et sécurisée entre les agents, améliorant ainsi la fonctionnalité des modèles de langage de toutes tailles dans des tâches nécessitant un raisonnement avancé, une planification et une résolution de problèmes.

« Cette avancée marque un tournant dans l'infrastructure de l'IA », a déclaré Caelum Forder, CTO de Coral, dans un communiqué écrit. « C'est la preuve que la mise à l'échelle horizontale n'est pas seulement possible, mais pratique, et Coral est le moyen le plus efficace de le faire. L'Internet des Agents est désormais une réalité fonctionnelle. Si vous êtes un développeur d'agents, il vous suffit de Coraliser. Si vous êtes un développeur d'applications, construisez-le mieux pour moins en utilisant notre infrastructure », a-t-il ajouté.

Coral Tops GAIA Benchmark, Valide la Puissance des Petits Modèles dans les Systèmes Agentiques Avancés

Dans un contexte de concurrence croissante pour développer des systèmes agentiques avancés, une grande partie de l'attention est restée portée sur l'augmentation de l'échelle des modèles pour gérer la complexité croissante des tâches. Les récentes performances de Coral remettent en question cette approche prédominante, s'alignant avec les conclusions d'une récente étude de NVIDIA suggérant que des systèmes plus petits peuvent offrir de hautes performances sans compromettre la vitesse, la sécurité ou l'efficacité. Le GAIA Benchmark, une suite d'évaluation complète pour l'IA avancée, est conçu pour évaluer dans quelle mesure les systèmes gèrent des tâches du monde réel qui nécessiteraient normalement un temps et des compétences considérables de la part d'experts humains. Comportant 450 invites complexes qui testent les capacités de recherche, d'analyse et de raisonnement, le benchmark sert de métrique clé de l'industrie pour évaluer l'efficacité des agents de modèle de langage général (LLM).

Le système GAIA Agent de Coral, utilisé dans le test de référence, est basé sur le protocole Coral et s'inspire des principes de conception de l'OWL de CAMEL. Il incorpore des agents spécialisés pour réaliser une gamme de tâches incluant la recherche, l'analyse, la critique, la planification et la navigation sur le web, toutes communiquant via l'infrastructure serveur MCP de Coral.

Être en tête du classement GAIA Benchmark pour les modèles plus petits indique le potentiel de Coral à étendre la fonctionnalité des systèmes d'IA via une structure basée sur des graphes. Ce résultat suggère que des agents légers et performants peuvent être créés en utilisant des modèles plus petits, facilitant ainsi un traitement de données plus large, une intégration plus fluide dans l'écosystème et une communication améliorée entre les agents.

« Le rôle des petits modèles dans les systèmes agentiques a été sous-estimé jusqu'à présent, mais la tendance commence à changer », a déclaré Caelum Forder. « Nous avons prouvé que ces modèles peuvent évoluer au-delà de leurs limites connues et surpasser les acteurs établis. Je suis convaincu qu'ils auront un rôle central à jouer dans l'avenir de l'IA agentique », a-t-il conclu.

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Partager
Commentaire
0/400
Aucun commentaire
  • Épingler
Trader les cryptos partout et à tout moment
qrCode
Scan pour télécharger Gate app
Communauté
Français (Afrique)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)