Synapse Software aplica la tecnología TurboQuant para reducir los costos de procesamiento de documentos de IA

Mensaje de Gate News, 15 de abril — Synapse Software ha integrado TurboQuant, un algoritmo de cuantización vectorial desarrollado por Google Research, en su solución Synap OCR IX para mejorar las capacidades de IA documental y, al mismo tiempo, reducir los costos de adopción de IA empresarial.

TurboQuant comprime la caché KV utilizada por los modelos de lenguaje grandes (LLMs) y los modelos de lenguaje de visión (VLMs), reduciendo el consumo de memoria al procesar documentos largos. Esto permite un procesamiento de datos más rápido en la misma infraestructura de GPU. La tecnología aborda cuellos de botella de memoria que anteriormente exigían una infraestructura de GPU costosa, especialmente para manejar contextos extendidos y el procesamiento por lotes grandes sin degradación del rendimiento.

Synapse Software también admite entornos basados en CPU para empresas que no pueden desplegar infraestructura de GPU. Mediante un perfilado de precisión, la empresa logró un procesamiento de inferencia solo con CPU de aproximadamente 100 documentos por minuto, manteniendo la pérdida de calidad por debajo del 1%, reduciendo el costo total de propiedad (TCO). El enfoque de infraestructura flexible permite la adopción de IA OCR en sectores sensibles a la seguridad, como las finanzas y la administración pública, donde antes el despliegue en instalaciones propias y las limitaciones de infraestructura han dificultado la implementación de IA.

Aviso legal: La información de esta página puede proceder de terceros y no representa los puntos de vista ni las opiniones de Gate. El contenido que aparece en esta página es solo para fines informativos y no constituye ningún tipo de asesoramiento financiero, de inversión o legal. Gate no garantiza la exactitud ni la integridad de la información y no se hace responsable de ninguna pérdida derivada del uso de esta información. Las inversiones en activos virtuales conllevan riesgos elevados y están sujetas a una volatilidad significativa de los precios. Podrías perder todo el capital invertido. Asegúrate de entender completamente los riesgos asociados y toma decisiones prudentes de acuerdo con tu situación financiera y tu tolerancia al riesgo. Para obtener más información, consulta el Aviso legal.

Artículos relacionados

DeepSeek V4-Flash se lanza en Ollama Cloud, servidor en EE. UU.: Claude Code, OpenClaw con un clic para conectar

Ollama Cloud ha publicado DeepSeek V4-Flash, con inferencia en servidores en Estados Unidos, y ofrece tres conjuntos de comandos de un solo clic para conectarse a Claude Code, OpenClaw y Hermes. V4-Flash/V4-Pro adoptan una arquitectura MoE, cuentan con soporte nativo de contexto 1M, y reducen costos con compresión Token-wise + atención dispersa DSA, logrando una reducción del 27% en FLOPs por token y una disminución del 10% en caché KV en escenarios de 1M. La API es compatible con OpenAI ChatCompletions y Anthropic, lo que facilita el cambio entre múltiples flujos de trabajo, y reduce el costo y el riesgo de soberanía de los datos.

ChainNewsAbmediahace9h

OristaPay lanza un sistema de pagos impulsado por IA en Telegram, habilita liquidaciones instantáneas de USDT en TON

Mensaje de Gate News, 24 de abril — OristaPay, una marca que opera bajo RD Technologies, anunció una vía de pago completa que permite a los agentes de IA ejecutar transacciones dentro del ecosistema de Telegram durante el Festival Web3 de Hong Kong. El sistema permite a los usuarios activar transacciones de activos digitales mediante interacciones de lenguaje natural sin salir de la interfaz de chat. Durante una demostración en vivo, un agente de IA impulsado por BytePlus procesó una solicitud de servicio, interpretó la intención del usuario e inició el pago a través del canal de OristaPay. La transacción se completó al instante usando USDT en la red de blockchain TON. La infraestructura de la plataforma se construye sobre cinco capacidades financieras fundamentales: cuentas por cobrar, cuentas por pagar, depósitos, remesas y gestión patrimonial, creando un ecosistema unificado que conecta activos de blockchain con casos de uso comerciales. OristaPay proporciona a los desarrolladores interfaces estandarizadas para integrar funcionalidades de pago en aplicaciones de IA con una complejidad mínima. La plataforma opera bajo el marco regulatorio de Hong Kong, posicionándola como una solución segura para empresas que hacen la transición hacia el comercio basado en Web3. La iniciativa busca abordar las limitaciones de las pasarelas de pago tradicionales combinando modelos de lenguaje a gran escala, infraestructura blockchain y plataformas sociales en un único ecosistema financiero.

GateNewshace12h

DBS amplía el programa de GenAI de Spark para las PYMES de Singapur

DBS anunció el 24 de abril la expansión de su programa Spark GenAI, desarrollado en asociación con Enterprise Singapore y la Autoridad de Desarrollo de Infocomm Media (IMDA), para apoyar a las pequeñas y medianas empresas locales (SMEs) en la adopción de inteligencia artificial. El programa utiliza una estructura de tres niveles

CryptoFrontierhace13h

Succinct Labs lanza la app iPhone ZCAM usando criptografía para combatir contenido generado por IA

Mensaje de Gate News, 24 de abril — Succinct Labs, respaldada por Paradigm, presentó ZCAM el jueves, una app para iPhone que usa criptografía para crear huellas digitales de fotos y videos con el fin de combatir el contenido generado y modificado por IA. La app firma fotos y videos en el momento de la captura, produciendo un registro a prueba de manipulaciones

GateNewshace16h

Claude amplía la funcionalidad de conectividad a aplicaciones cotidianas, integrando herramientas para el ocio y el entretenimiento y para el gasto de consumo

Claude amplía Connectors, agrega herramientas cotidianas como AllTrails, Booking, Instacart, Audible, Spotify, TripAdvisor, y puede ayudar en tareas de ocio, viajes y declaración de impuestos en las conversaciones, recomendar dinámicamente herramientas según el contexto y poder usar varias herramientas al mismo tiempo. Disponible en escritorio, en pruebas en dispositivos móviles; mantiene la privacidad sin anuncios y basada en la autorización, y no usa datos para entrenar.

ChainNewsAbmediahace19h
Comentar
0/400
Sin comentarios