Xiaomi e MiniMax lançam simultaneamente grandes novidades, iniciando oficialmente a guerra de preços do Agent

robot
Geração de resumo em curso

Título original: Xiaomi e MiniMax lançam simultaneamente grandes novidades, início oficial da guerra de preços dos Agents

Autor original:律动BlockBeats

Fonte original:

Reprodução: Mars Finance

Nos dias 18 e 19 de março, duas empresas chinesas lançaram sucessivamente seus grandes modelos de Agent. A startup de IA doméstica MiniMax lançou o M2.7, enquanto a equipe de grandes modelos da Xiaomi, MiMo, apresentou o V2-Pro. Ambos os modelos estão entre os melhores do mundo no benchmark de Agent, mas seus preços de API de saída são respectivamente 1/21 e 1/8 do Claude Opus 4.6.

As duas empresas lançaram suas estratégias na mesma semana, mas suas cartas são completamente diferentes. Representam duas rotas tecnológicas distintas, apostando em dois futuros diferentes para a era dos Agents.

Mesma prova, taxa de matrícula de 1/17

Vamos começar com uma comparação mais direta.

De acordo com dados do OpenRouter e das páginas oficiais de preços de cada empresa, considerando o preço por API de saída (por milhão de tokens), o MiniMax M2.7 custa US$1,20, enquanto o MiMo V2-Pro custa US$3,00. Como referência, o preço de saída do Claude Opus 4.6 é US$25, o GPT-5.2 é US$14 e o Claude Sonnet 4.6 é US$15.

A diferença de preço é de várias ordens de magnitude, mas a diferença de capacidade não. No SWE-bench Verified (atualmente o benchmark mais popular para avaliar habilidades de engenharia de código), o MiMo V2-Pro alcançou 78%, enquanto o Sonnet 4.6 obteve 79,6%, uma diferença de menos de dois pontos percentuais. O M2.7 obteve 56,22% no SWE-Pro, empatando com o GPT-5.3-Codex. No VIBE-Pro (avaliação de capacidade de entrega de projetos ponta a ponta), o M2.7 atingiu 55,6%, próximo ao nível do Opus 4.6.

O foco desta comparação não está em quem é melhor ou pior — os sistemas de benchmark de cada empresa não estão totalmente alinhados, portanto, comparações diretas devem ser feitas com cautela. O ponto principal é a “diferença de preço e desempenho”: modelos Agent nacionais já atingiram o mesmo nível de capacidade, mas estão em faixas de preço completamente diferentes.

Parâmetros de trilhões vs autoevolução

O preço é apenas uma aparência. Ambas as empresas apresentaram estratégias completamente diferentes.

O MiMo V2-Pro segue uma abordagem de “grande força, grandes resultados”. Segundo anúncio oficial da Xiaomi, o V2-Pro possui mais de 1 trilhão de parâmetros totais, com 42 bilhões de parâmetros ativados, suportando contextos de até 1 milhão de tokens. Sua inovação central é o mecanismo de atenção híbrido (Hybrid Attention), que combina atenção de janela deslizante (SWA) com atenção global (GA), na proporção de 7:1 — a versão anterior, V2-Flash, tinha uma proporção de 5:1. Essa arquitetura torna o modelo mais estável ao lidar com documentos longos e chamadas paralelas de múltiplas ferramentas em cenários de Agent. No PinchBench (avaliação de capacidade de uso de ferramentas de Agent), o MiMo V2-Pro obteve 84%.

O M2.7 seguiu um caminho totalmente diferente. Segundo o blog técnico oficial publicado em 18 de março pela MiniMax, a quantidade de parâmetros do M2.7 não foi divulgada, mas ele apresenta um mecanismo de “autoevolução iterativa”: o modelo realiza mais de 100 ciclos de otimização autônoma, incluindo análise de trajetórias de falha, planejamento de modificações, alteração de sua própria arquitetura de código, execução de avaliações e ciclos repetidos, alcançando uma melhoria de desempenho de 30% na avaliação interna. Em 22 questões de alta dificuldade do MLE Bench Lite (avaliação de desafios de aprendizado de máquina), o M2.7 conquistou 9 medalhas de ouro, 5 de prata e 1 de bronze, com uma taxa média de medalhas de 66,6%.

De cinco dimensões, as duas rotas mostram diferenças claras: o MiMo V2-Pro domina em comprimento de contexto e capacidade de engenharia de código, enquanto o M2.7 se destaca em automação de tarefas e autoevolução. Segundo o mesmo blog técnico da MiniMax, o M2.7 obteve uma pontuação de ELO 1495 no GDPval-AA (avaliação de processamento de documentos de escritório), sendo o melhor modelo de código aberto, e manteve uma taxa de conformidade de 97% em mais de 40 habilidades complexas no teste MM-Claw.

Cinco meses, quatro versões

Além das diferenças tecnológicas, o ritmo de iteração também é totalmente distinto.

De acordo com registros públicos, a MiniMax lançou quatro versões em cinco meses, de outubro de 2025 (M2) a março de 2026 (M2.7), com uma média de uma grande versão a cada 49 dias. Entre M2 e M2.7, o intervalo foi de aproximadamente 30 dias.

A Xiaomi, por sua vez, adotou um ritmo diferente: lançou o MiMo-7B (modelo de inferência de 7 bilhões de parâmetros) em abril de 2025, o V2-Flash (com 309 bilhões de parâmetros) em dezembro do mesmo ano, e o V2-Pro (com 1 trilhão de parâmetros) em março de 2026. Cada geração apresenta uma escala de parâmetros maior, mas os intervalos entre versões também são mais longos.

A MiniMax optou por passos pequenos e rápidos, com alta frequência de atualizações, e o mecanismo de autoevolução do M2.7 foi projetado para “evolução contínua”. A Xiaomi, por outro lado, prefere uma abordagem de impacto maior, com cada versão representando uma grande mudança em escala de parâmetros e arquitetura.

Anônimo em 8 dias, liderando o OpenRouter

Além das estratégias tecnológicas, a estratégia de lançamento da Xiaomi também quebrou paradigmas do setor.

Segundo a Reuters, em 11 de março, um modelo anônimo chamado Hunter Alpha apareceu na maior plataforma de agregação de APIs do mundo, OpenRouter. Sem respaldo de marca, sem evento de lançamento, sem blog técnico. Seu preço de API era extremamente baixo, mas seu desempenho surpreendentemente forte.

A comunidade começou a especular sobre sua origem. Segundo Republic World e várias mídias de tecnologia, a hipótese mais aceita é que seja o DeepSeek V4, já que o responsável pela equipe MiMo, Luo Fuli, trabalhou anteriormente na DeepSeek. O volume de chamadas aumentou rapidamente, atingindo mais de 1 trilhão de tokens durante o período anônimo, conquistando o topo do ranking semanal do OpenRouter.

Na madrugada de 19 de março, a Xiaomi revelou: Hunter Alpha é o próprio MiMo V2-Pro. Segundo o mesmo artigo da Reuters, após a revelação, as ações da Xiaomi na bolsa de Hong Kong chegaram a subir 5,8%.

Esta foi a primeira vez que um grande modelo nacional provou seu desempenho em uma plataforma global por meio de teste cego. Sem depender de marca ou publicidade, em apenas 8 dias, os desenvolvedores votaram com seus passos.

Ver original
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
  • Recompensa
  • Comentar
  • Republicar
  • Partilhar
Comentar
Adicionar um comentário
Adicionar um comentário
Nenhum comentário
  • Fixar