Publication du modèle Mercury 2, axé sur une inférence rapide et un bon rapport qualité-prix

robot
Création du résumé en cours

AIMPACT message, le 28 avril (UTC+8), Stefano Ermon a publié un tweet le 28 avril 2026, annonçant que le modèle Mercury 2 était prêt.
Ce modèle, basé sur un déploiement GPU, vise un niveau de vitesse comparable à celui de solutions comme Cerebras, avec une capacité à gérer le trafic de production.
Le tweet s’adresse aux utilisateurs abandonnés par Cerebras, affirmant que Mercury 2 offre une vitesse d’inférence de plus de 1 000 tok/s, une qualité équivalente à Haiku/Flash, et un prix de 0,75 dollar par million de tokens de sortie.
L’adresse email de contact est sid@inceptionlabs.ai. (Source : InFoQ)

Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler