A Ramp Labs apresenta uma nova solução para a partilha de memória entre múltiplos agentes, reduzindo o consumo de tokens em até 65%

GateNews

Notícias do Gate News, a 11 de abril, a empresa de infraestruturas de IA Ramp Labs publicou resultados de investigação «Latent Briefing», permitindo uma partilha eficiente de memória entre sistemas multiagente através da compressão direta da cache KV de grandes modelos. Isto faz uma grande redução do consumo de Tokens sem perda de exatidão. Nas arquiteturas multiagente mais comuns, o orquestrador (Orchestrator) decompõe tarefas e chama repetidamente modelos de trabalhadores (Worker). À medida que a cadeia de inferência se vai tornando mais longa, a quantidade de Tokens cresce de forma exponencial. A ideia central do Latent Briefing é, com o auxílio do mecanismo de atenção, identificar as partes verdadeiramente essenciais no contexto e eliminar informação redundante diretamente na camada de representação, em vez de depender de resumos de LLM que são lentos ou de pesquisas RAG com baixa estabilidade. Nos testes de referência do LongBench v2, o método teve um desempenho notável: o consumo de Tokens do modelo Worker diminuiu 65%, a mediana de Tokens poupados em documentos de comprimento médio (32k a 100k) atingiu 49%, a exatidão global melhorou cerca de 3 pontos percentuais face à linha de base e o tempo adicional para cada compressão foi apenas de cerca de 1,7 segundos, o que equivale a acelerar aproximadamente 20 vezes em relação ao algoritmo original. O experimento usou Claude Sonnet 4 como orquestrador e Qwen3-14B como modelo de trabalhador, cobrindo cenários de documentos variados, como artigos académicos, documentos jurídicos, romances e relatórios governamentais. O estudo também descobriu que o limiar de compressão ideal varia em função da dificuldade da tarefa e do comprimento do documento — para tarefas difíceis, é mais adequado uma compressão mais agressiva para filtrar ruído de inferência oportunista; para documentos longos, é mais apropriada uma compressão mais ligeira para preservar informação-chave dispersa.

Aviso: As informações nesta página podem ser provenientes de terceiros e não representam as opiniões ou pontos de vista da Gate. O conteúdo exibido nesta página é apenas para referência e não constitui aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou integridade das informações e não será responsável por quaisquer perdas decorrentes do uso dessas informações. Os investimentos em ativos virtuais apresentam altos riscos e estão sujeitos a uma volatilidade de preços significativa. Você pode perder todo o capital investido. Por favor, compreenda completamente os riscos envolvidos e tome decisões prudentes com base em sua própria situação financeira e tolerância ao risco. Para mais detalhes, consulte o Aviso Legal.

Related Articles

Emirados Árabes Unidos anuncia mudança em direção a um modelo de governo com IA nos próximos dois anos

Sua Alteza Sheikh Mohammed bin Rashid Al Maktoum afirmou que o objetivo era fazer com que 50% dos setores do governo operassem por meio de IA agentica autônoma. A transição também incluirá o treinamento de funcionários federais para “dominar IA” e será supervisionada por Sheikh Mansour bin Zayed. Principais destaques:

Coinpedia15h atrás

Plataforma de negociação com IA Fere AI arrecada US$ 1,3M em financiamento liderado pela Ethereal Ventures

Mensagem de notícias da Gate, 25 de abril — A Fere AI, uma plataforma de negociação de ativos digitais alimentada por IA, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão liderada pela Ethereal Ventures, com participação da Galaxy Vision Hill e da Kosmos Ventures, de acordo com a Globenewswire. A plataforma oferece suporte a redes cross-chain

GateNews16h atrás

Nvidia Implementa o Agente de IA Codex da OpenAI em Toda a Força de Trabalho na Infraestrutura Blackwell

Mensagem do Gate News, 25 de abril — A Nvidia lançou o Codex, da OpenAI, um agente de IA alimentado pelo GPT-5.5, para toda a sua força de trabalho após um teste bem-sucedido com aproximadamente 10.000 funcionários, de acordo com comunicações internas do CEO Jensen Huang e do CEO da OpenAI, Sam Altman. Codex é projetado para ajudar com

GateNews21h atrás

Startup de Codificação com IA Cognition em Conversas para Rodada de Financiamento com Avaliação de $25B Valuation

Mensagem do Gate News, 25 de abril — A startup de codificação com IA Cognition está em conversas iniciais para captar centenas de milhões de dólares ou mais, com uma avaliação de aproximadamente um $25 bilhão, de acordo com pessoas familiarizadas com o assunto. O interesse aumentou após a aquisição, pela SpaceX, de uma startup rival de codificação com IA. Co

GateNews21h atrás

Plataforma de Agentes de Negociação com IA Fere AI Levanta US$ 1,3M, Liderada pela Ethereal Ventures

Mensagem do Gate News, 25 de abril — A plataforma de agentes de negociação de ativos digitais com IA, Fere AI, anunciou a conclusão de uma rodada de financiamento de US$ 1,3 milhão, liderada pela Ethereal Ventures, com a participação da Galaxy Vision Hill e da Kosmos Ventures. A plataforma oferece suporte a redes cross-chain, incluindo Ethereum,

GateNews22h atrás

OpenClaw v2026.4.23 Adiciona Suporte Direto a OAuth do gpt-image-2, Introduz o Modo de Contexto Forked para Subagentes

Mensagem do Gate News, 25 de abril — OpenClaw, uma estrutura de agentes de IA de código aberto, lançou a v2026.4.23 em 23 de abril, introduzindo atualizações em geração de imagens, mecanismos de subagentes e reforços de segurança. As melhorias na geração de imagens permitem que gpt-image-2 seja chamado diretamente via Codex OAuth sem

GateNews23h atrás
Comentário
0/400
Sem comentários