¿Cuál es el mejor modelo de IA para gestionar tu negocio? El que miente mejor, aparentemente
En resumen
La Arena Vending-Bench probó agentes de IA que gestionaban negocios de máquinas expendedoras en competencia.
Los modelos principales aumentaron las ganancias mediante manipulación de precios, colusión y tácticas engañosas. Claude fue el mejor en estas tácticas.
GLM-5 derrotó a Claude haciéndose pasar por un compañero de equipo y extrayendo
GLM-0,64%
Decrypt·02-19 16:06