De acordo com a monitorização da 1M AI News, o fundador do Moonlit Shadow, Yang Zhilin, presidiu uma mesa redonda sobre OpenClaw e temas de código aberto de IA na Cúpula Zhongguancun 2026. Os convidados incluíram o CEO da Zhipu Huazhang, Zhang Peng; o cofundador e CEO da Wuwen Core, Xia Lixue; Luo Fuli, responsável pelo grande modelo MiMo da Xiaomi; e Huang Chao, professor assistente na Universidade de Hong Kong. A discussão abrangeu três níveis: modelos, infraestrutura de computação e aplicações de agentes.
Xia Lixue apresentou um dado direto: desde o final de janeiro, o uso de tokens pela Wuwen Core dobrou a cada duas semanas, acumulando um aumento de dez vezes, e ela comentou: “Essa velocidade só tinha visto na era do 3G, quando o tráfego móvel era assim.” Zhang Peng explicou, do ponto de vista de um fabricante de modelos, a lógica por trás do recente aumento de preço do GLM5 Turbo da Zhipu: os agentes não são mais apenas perguntas e respostas; completar uma tarefa pode consumir dez ou até cem vezes mais tokens do que responder a uma questão simples. Isso envolve planejamento de tarefas de longo prazo, debug contínuo e processamento de informações multimodais. “Competir por preços baixos a longo prazo não é benéfico para o desenvolvimento de toda a indústria.”
Fuli acredita que o principal gargalo na era dos agentes é o custo e a velocidade de raciocínio com contextos longos. Só quando for possível manter custos baixos e alta velocidade com contextos de milhões ou até dezenas de milhões de tokens, tarefas de alta produtividade poderão ser entregues aos modelos. Ela revelou que a “auto-evolução” dos modelos já saiu do conceito para a prática. Em tarefas de pesquisa científica com objetivos claros, os modelos já podem operar autonomamente por dois ou três dias, acelerando a eficiência de suas equipes quase dez vezes. Ela também levantou uma questão: a demanda por raciocínio cresceu quase dez vezes na última fase, e o crescimento total de tokens neste ano poderá chegar a cem vezes?
Huang Chao analisou três gargalos técnicos na camada de aplicações de agentes: insuficiência na capacidade de planejamento de tarefas de longa duração, a pressão de expansão de memória causada pela colaboração de múltiplos agentes, e os riscos de ferramentas de baixa qualidade e injeções maliciosas no ecossistema de habilidades. Ele apontou que a gestão de memória nos frameworks atuais ainda se limita a sistemas de arquivos e ao formato Markdown, e que no futuro será necessário avançar para um design em camadas.
No encerramento da mesa redonda, os quatro convidados resumiram as tendências para os próximos 12 meses com uma palavra cada: