Anthropic prepara o Opus 4.7 e o Studio de IA Full-Stack—Enquanto Está Sentado em Algo Muito Mais Assustador

Resumidamente

  • Anthropic está preparando o Claude Opus 4.7 e uma ferramenta de design de IA para sites e apresentações
  • Claude Mythos continua sendo o verdadeiro modelo de fronteira da Anthropic, e a empresa não o lançará publicamente.
  • A indústria ainda não consegue medir de forma confiável as melhorias de IA, tornando difícil verificar as alegações sobre os ganhos do Opus 4.7.

A Anthropic está se preparando para lançar o Claude Opus 4.7 junto com uma nova ferramenta de design alimentada por IA que permite aos usuários construir sites, apresentações e páginas de destino com comandos em inglês simples—uma notícia que causou uma queda nas ações da Adobe, Wix e Figma na segunda-feira, de acordo com The Information. Os produtos podem ser lançados já nesta semana, disse uma pessoa familiarizada com os planos à The Information. A ferramenta de design é voltada tanto para desenvolvedores quanto para usuários não técnicos, colocando-a em rota de colisão com startups como Gamma e o Stitch do Google. A Anthropic não respondeu ao pedido de comentário do Decrypt.

O Opus 4.7 nem mesmo é o modelo mais poderoso da Anthropic. Esse título pertence ao Claude Mythos—uma fera focada em cibersegurança que a empresa está entregando discretamente a algumas firmas de segurança enquanto mantém longe do público.  Recentemente, o Instituto de Segurança de IA do Reino Unido avaliou o Mythos Preview e descobriu que ele pode executar ataques cibernéticos sofisticados de forma autônoma a taxas que nenhum outro modelo conseguiu igualar. Tornou-se o primeiro IA a completar “The Last Ones”, uma simulação de ataque a rede corporativa com 32 etapas que normalmente leva equipes vermelhas humanas 20 horas. Mythos conseguiu em três de cada dez tentativas, com uma média de 22 de 32 etapas—em comparação com o Opus 4.6, que alcançou 16. Isso importa além da segurança empresarial. Medir o que a IA realmente pode fazer virou uma dor de cabeça para toda a indústria. A OpenAI recentemente chamou o principal benchmark de codificação de “contaminado”, mas os modelos continuam sendo comparados usando esses mesmos testes. Uma avaliação separada do ARC-AGI-3 mostrou o Gemini com 0,37% e o GPT-5.4 atingindo 0,26%—enquanto humanos alcançaram 100%. O resultado é um cenário onde os benchmarks são contestados e ainda usados como evidência, dificultando a contextualização das alegações sobre os avanços do Opus 4.7 até que a Anthropic lance um cartão de modelo detalhado.

A relação entre Opus e Mythos é mais próxima do que a maioria imagina. A Anthropic constrói seus modelos de fronteira ajustando finamente a linha Opus—a mesma base que alimenta os produtos públicos do Claude é testada e fortalecida até se transformar em Mythos. O Opus 4.7 é a fundação que eventualmente recebe o treinamento de kung fu em cibersegurança. Além disso, os esforços da Anthropic têm se direcionado mais para o desenvolvimento/uso empresarial. O vazamento do código do Claude, o lançamento do sistema de habilidades e do protocolo MCP, o foco em IA agentic e o cuidado com benchmarks de codificação tornam isso ainda mais evidente. Embora a Anthropic não tenha anunciado oficialmente, os vazamentos reforçam a mudança mais ampla de um provedor de LLM para algo que se assemelha a um modelo de “estúdio de IA” de pilha completa, onde o Claude não apenas gera texto, mas constrói e implanta produtos completos.

Ver original
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar