Informe profundo de DWF: La IA supera a los humanos en optimización de rendimientos en DeFi, pero las transacciones complejas aún están 5 veces por detrás

Autor: DWF Ventures

Traducido por: Deep潮 TechFlow

Deep潮 introducción: Los agentes de IA ya representan casi una quinta parte del volumen de operaciones en DeFi, y en escenarios de optimización de rendimiento con reglas claras, realmente superan a los humanos. Pero si se trata de que operen de forma autónoma, el rendimiento de los mejores IA aún es solo una quinta parte del de los mejores humanos. Este estudio desglosa el rendimiento real de la IA en diferentes escenarios de DeFi, y vale la pena que lo revisen todos los interesados en la automatización de operaciones.

Puntos clave

La actividad de automatización y agentes actualmente representa aproximadamente el 19% de todas las actividades en la cadena, pero la verdadera autonomía de extremo a extremo aún no se ha logrado.

En casos de uso estrechos y con reglas claramente definidas, los agentes ya muestran un rendimiento superior al de humanos y bots. Pero para acciones múltiples como operaciones, los humanos superan a los agentes.

Entre los agentes, la selección de modelos y la gestión de riesgos tienen el mayor impacto en el rendimiento de las operaciones.

A medida que los agentes se adoptan a gran escala, existen múltiples riesgos relacionados con la confianza y la ejecución, incluyendo ataques de brujas, congestión de estrategias y compromisos de privacidad.

Actividad de agentes en crecimiento continuo

En el último año, la actividad de agentes ha crecido de manera constante, aumentando tanto en volumen como en número de transacciones. Vemos que el protocolo x402 de Coinbase lidera un gran avance, y jugadores como Visa, Stripe y Google también se han unido lanzando sus propios estándares. La mayor parte de la infraestructura en desarrollo actualmente está diseñada para servir a dos escenarios: canales entre agentes o llamadas a agentes activadas por humanos.

Aunque las transacciones con stablecoins ya cuentan con soporte generalizado, la infraestructura actual todavía depende de pasarelas de pago tradicionales como base, lo que implica que aún dependen de contrapartes centralizadas. Por lo tanto, el escenario de “total autonomía” en el que los agentes se financian, ejecutan y optimizan continuamente según las condiciones cambiantes aún no se ha alcanzado.

Los agentes no son completamente desconocidos en DeFi. Durante años, los protocolos en la cadena han tenido automatizaciones mediante bots para capturar MEV o obtener ganancias excesivas que no serían posibles sin código. Estos sistemas funcionan muy bien bajo parámetros claramente definidos que no cambian con frecuencia ni requieren supervisión adicional. Sin embargo, el mercado se ha vuelto más complejo con el tiempo. Aquí es donde entra la nueva generación de agentes, ya que en los últimos meses la cadena se ha convertido en un campo de experimentación para estas actividades.

Rendimiento real de los agentes

Según el informe, la actividad de agentes ha crecido exponencialmente, con más de 17,000 agentes lanzados desde 2025. La actividad total de automatización/agentes se estima que cubre más del 19% de todas las actividades en la cadena. No es sorprendente, ya que se estima que más del 76% de las transferencias de stablecoins son generadas por bots. Esto indica un gran potencial de crecimiento para la actividad de agentes en DeFi.

La autonomía de los agentes abarca un amplio rango, desde experiencias tipo chatbot que requieren supervisión humana intensiva, hasta agentes que pueden adaptar sus estrategias en función de objetivos y condiciones del mercado. En comparación con los bots, los agentes tienen varias ventajas clave, incluyendo la capacidad de responder y actuar en milisegundos ante nueva información, y la posibilidad de ampliar su cobertura a miles de mercados manteniendo un mismo nivel de rigor.

Actualmente, la mayoría de los agentes todavía están en niveles de analistas o copilotos, ya que la mayoría aún están en fase de prueba.

Optimización de rendimiento: rendimiento sobresaliente de los agentes

La provisión de liquidez es un campo donde la automatización ya es frecuente, y el TVL total en manos de agentes supera los 39 millones de dólares. Esta cifra mide principalmente los activos depositados directamente por usuarios en los agentes, sin incluir el capital en rutas de vaults.

Giza Tech es uno de los protocolos más grandes en este campo, lanzando a finales del año pasado su primera aplicación de agentes, ARMA, diseñada para mejorar la captura de rendimiento en los principales protocolos DeFi. Ha gestionado más de 19 millones de dólares en activos y generado más de 4 mil millones de dólares en volumen de operaciones de agentes. La alta proporción entre volumen y activos gestionados indica que los agentes reequilibran capital con frecuencia, logrando así capturar mayores rendimientos. Una vez que el capital se deposita en el contrato, la ejecución se automatiza, ofreciendo a los usuarios una experiencia sencilla de un clic, con casi ninguna supervisión.

El rendimiento de ARMA ha sido notable, generando más del 9.75% de rendimiento anualizado en USDC. Incluso considerando costos adicionales de reequilibrio y una comisión del 10% sobre los beneficios, la tasa de retorno supera la de préstamos tradicionales en Aave o Morpho. Sin embargo, la escalabilidad sigue siendo un problema clave, ya que estos agentes aún no han sido probados en escenarios de gestión o expansión a la escala de los principales protocolos DeFi.

Operaciones: los humanos muy por delante

Pero en acciones más complejas como las operaciones, los resultados son mucho más variados. Los modelos actuales funcionan basándose en entradas definidas por humanos y producen salidas según reglas preestablecidas. El aprendizaje automático ha llevado esto a un rol de copiloto, permitiendo que los modelos actualicen su comportamiento con nueva información sin necesidad de reprogramación explícita. Con la llegada de agentes totalmente autónomos, el panorama de las operaciones cambiará radicalmente.

Se han organizado varias competencias entre agentes y entre humanos y agentes, y los resultados muestran diferencias significativas entre modelos. Trade XYZ realizó una competencia de trading entre humanos y agentes en su plataforma de acciones listadas. Cada cuenta empezó con 10,000 dólares, sin límites en apalancamiento o frecuencia de operaciones. Los resultados favorecieron abrumadoramente a los humanos, con los mejores humanos superando a los mejores agentes por más de 5 veces.

Por otro lado, Nof1 organizó una competencia entre modelos de agentes (Grok-4, GPT-5, Deepseek, Kimi, Qwen3, Claude, Gemini), poniendo a prueba diferentes configuraciones de riesgo, desde preservación de capital hasta apalancamientos máximos. Los hallazgos clave incluyen:

Tiempo en posición: existe una fuerte correlación, y los modelos que mantienen posiciones durante 2-3 horas en promedio superan ampliamente a los que cambian de posición con mayor frecuencia.

Valor esperado: mide si en promedio las operaciones son rentables. Curiosamente, solo los tres mejores modelos tienen valor esperado positivo, lo que indica que la mayoría de los modelos pierden en más operaciones de las que ganan.

Apalancamiento: niveles bajos de apalancamiento, entre 6 y 8 veces, demostraron un mejor rendimiento que modelos con más de 10 veces, ya que el alto apalancamiento acelera las pérdidas.

Estrategias de señal: Monk Mode fue el modelo con mejor rendimiento hasta ahora, mientras que Situational Awareness fue el peor. Basado en las características del modelo, muestra que centrarse en la gestión de riesgos y reducir las fuentes externas puede mejorar los resultados.

Modelos base: Grok 4.20 superó significativamente a otros modelos en diferentes estrategias de señal, con más del 22% de ventaja, y fue el único con rentabilidad promedio positiva.

Otros factores como preferencias de long/short, tamaño de las operaciones y puntuaciones de confianza no tienen datos suficientes o no muestran correlación positiva con el rendimiento del modelo. En general, los resultados indican que los agentes tienden a rendir mejor dentro de límites claramente definidos, lo que significa que los humanos aún son muy necesarios en la configuración de objetivos.

Cómo evaluar a los agentes

Dado que los agentes todavía están en una etapa temprana, no existe un marco de evaluación completo. El rendimiento histórico suele usarse como referencia, pero está influenciado por factores subyacentes que ofrecen indicios más fuertes del potencial de los agentes.

Rendimiento en diferentes volatilidades: incluye control disciplinado de pérdidas en condiciones adversas, lo que indica que los agentes pueden identificar factores fuera de la cadena que afectan la rentabilidad.

Transparencia y privacidad: ambos tienen sus trade-offs. Los agentes transparentes, si pueden ser copiados activamente, en realidad no tienen ventajas estratégicas. Los agentes privados enfrentan riesgos de extracción de información por parte de los creadores, quienes pueden aprovecharse de sus propios usuarios.

Fuentes de información: la calidad y confiabilidad de los datos a los que acceden los agentes son cruciales para sus decisiones. Es vital asegurar que las fuentes sean confiables y no dependan excesivamente de una sola.

Seguridad: contar con auditorías de contratos inteligentes y una arquitectura de custodia de fondos adecuada es esencial para tener medidas de respaldo en eventos imprevistos.

Próximos pasos para los agentes

Para una adopción masiva, aún hay mucho trabajo en infraestructura. Esto se resume en resolver problemas clave relacionados con la confianza y la ejecución de los agentes autónomos. Sin barreras, ya han ocurrido casos de mala gestión de fondos.

ERC-8004, lanzado en enero de 2026, será el primer registro en cadena que permitirá a los agentes autónomos descubrirse entre sí, construir reputaciones verificables y colaborar de forma segura. Esto desbloquea la composabilidad en DeFi, ya que la puntuación de confianza estará integrada en los contratos inteligentes, permitiendo actividades sin permisos entre agentes y protocolos. Sin embargo, esto no garantiza que los agentes siempre operen de manera no maliciosa, ya que vulnerabilidades como la colusión y ataques de brujas aún pueden ocurrir. Por ello, aún hay mucho espacio para mejorar en seguros, seguridad y staking económico de los agentes.

A medida que la actividad de agentes en DeFi crece, la congestión de estrategias se convierte en un riesgo estructural. Los yield farms son un ejemplo claro: a medida que estas estrategias se popularizan, las recompensas se comprimen. Lo mismo puede suceder en operaciones de agentes: si muchos agentes entrenan y optimizan en datos similares y persiguen objetivos similares, tenderán a converger en posiciones y señales de salida similares.

El artículo de CoinAlg de enero de 2026, de la Universidad de Cornell, formaliza esta problemática. Los agentes transparentes pueden ser objeto de arbitraje, ya que sus operaciones son predecibles y pueden ser adelantadas. Los agentes privados evitan este riesgo, pero introducen otros, como que los creadores retengan ventajas internas y puedan extraer valor de conocimientos internos que deberían estar protegidos por la opacidad.

La actividad de agentes solo acelerará, y la infraestructura que se construya hoy determinará cómo funcionará la próxima fase de las finanzas en cadena. A medida que aumente su uso, se auto-mejorarán y serán más sensibles a las preferencias de los usuarios. Por ello, la diferenciación principal dependerá de la confianza en la infraestructura, que será clave para captar la mayor cuota de mercado.

GIZA-0,29%
Ver original
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
  • Recompensa
  • Comentar
  • Republicar
  • Compartir
Comentar
Añadir un comentario
Añadir un comentario
Sin comentarios
  • Anclado