Synapse Software applique la technologie TurboQuant pour réduire les coûts de traitement des documents d’IA

Message Gate News, 15 avril — Synapse Software a intégré TurboQuant, un algorithme de quantification vectorielle développé par Google Research, dans sa solution Synap OCR IX afin d’améliorer les capacités d’IA documentaire tout en réduisant les coûts d’adoption de l’IA en entreprise.

TurboQuant compresse le cache KV utilisé par les grands modèles de langage (LLMs) et les modèles de langage vision (VLMs), réduisant la consommation mémoire lors du traitement de documents longs. Cela permet un traitement des données plus rapide sur la même infrastructure GPU. La technologie répond aux goulots d’étranglement de mémoire qui nécessitaient auparavant une infrastructure GPU coûteuse, en particulier pour gérer des contextes étendus et des traitements par lots volumineux sans dégradation des performances.

Synapse Software prend également en charge des environnements basés sur le CPU pour les entreprises qui ne peuvent pas déployer d’infrastructure GPU. Grâce à un profilage de précision, l’entreprise a atteint un traitement d’inférence uniquement sur CPU d’environ 100 documents par minute, avec une perte de qualité maintenue en dessous de 1%, ce qui réduit le coût total de possession (TCO). Cette approche d’infrastructure flexible permet l’adoption de l’OCR par IA dans des secteurs sensibles à la sécurité tels que la finance et l’administration publique, où le déploiement sur site et les contraintes d’infrastructure ont auparavant freiné la mise en œuvre de l’IA.

Avertissement : Les informations contenues dans cette page peuvent provenir de tiers et ne représentent pas les points de vue ou les opinions de Gate. Le contenu de cette page est fourni à titre de référence uniquement et ne constitue pas un conseil financier, d'investissement ou juridique. Gate ne garantit pas l'exactitude ou l'exhaustivité des informations et n'est pas responsable des pertes résultant de l'utilisation de ces informations. Les investissements en actifs virtuels comportent des risques élevés et sont soumis à une forte volatilité des prix. Vous pouvez perdre la totalité du capital investi. Veuillez comprendre pleinement les risques pertinents et prendre des décisions prudentes en fonction de votre propre situation financière et de votre tolérance au risque. Pour plus de détails, veuillez consulter l'avertissement.

Articles similaires

DeepSeek V4-Flash arrive sur Ollama Cloud, hôtes américains : Claude Code, OpenClaw connexion en un clic

Ollama Cloud a mis en ligne DeepSeek V4-Flash, avec l'inférence sur des serveurs aux États-Unis, et propose trois ensembles de commandes en un clic pour se connecter à Claude Code, OpenClaw et Hermes. V4-Flash/V4-Pro utilisent une architecture MoE, avec une prise en charge native du contexte 1M, et réduisent les coûts grâce à une compression Token-wise + une attention clairsemée DSA ; dans un scénario de 1M, les FLOPs par token diminuent de 27 % et le cache KV baisse de 10 %. L'API est compatible avec OpenAI ChatCompletions et Anthropic, ce qui facilite le basculement entre plusieurs flux de travail, réduit les coûts et les risques liés à la souveraineté des données.

ChainNewsAbmediaIl y a 3h

OristaPay lance un système de paiement alimenté par l’IA sur Telegram, permet des règlements USDT instantanés sur TON

Message des Gate News, 24 avril — OristaPay, une marque opérant sous RD Technologies, a annoncé une voie de paiement complète permettant aux agents d’IA d’exécuter des transactions au sein de l’écosystème Telegram pendant le Hong Kong Web3 Festival. Le système permet aux utilisateurs de déclencher des transactions d’actifs numériques via des interactions en langage naturel sans quitter l’interface de discussion.

GateNewsIl y a 7h

DBS étend le programme Spark GenAI pour les PME à Singapour

DBS a annoncé le 24 avril l’expansion de son programme Spark GenAI, développé en partenariat avec Enterprise Singapore et l’Autorité pour le développement des technologies de l’information et des communications (IMDA), afin de soutenir les petites et moyennes entreprises locales (SMEs) dans l’adoption de l’intelligence artificielle. Le programme utilise une approche en trois niveaux

CryptoFrontierIl y a 8h

Succinct Labs lance l’application iPhone ZCAM, utilisant la cryptographie pour lutter contre les contenus générés par l’IA

Message de Gate News, 24 avril — Succinct Labs, soutenu par Paradigm, a dévoilé ZCAM jeudi, une application iPhone qui utilise la cryptographie pour établir l’empreinte numérique des photos et des vidéos afin de lutter contre les contenus générés et modifiés par l’IA. L’app signe les photos et les vidéos au moment de la capture, produisant un enregistrement infalsifiable

GateNewsIl y a 11h

Claude étend les fonctionnalités de connexion aux applications quotidiennes, en intégrant des outils de consommation de loisirs et de divertissement

Claude étend Connectors, ajoute des outils du quotidien tels que AllTrails, Booking, Instacart, Audible, Spotify, TripAdvisor, et peut aider à des tâches de loisirs, de voyage et de déclaration d’impôts dans le dialogue. Il recommande dynamiquement des outils selon le contexte et peut utiliser plusieurs outils en même temps. Déployé sur le bureau, testé sur mobile ; préserve la confidentialité sans publicité, sous réserve d’une autorisation, et n’utilise pas les données pour l’entraînement.

ChainNewsAbmediaIl y a 14h
Commentaire
0/400
Aucun commentaire