Escaneie para baixar o app da Gate
qrCode
Mais opções de download
Não me lembre de novo hoje

Modelos de IA Frontier demonstram capacidade ao nível humano em explorações de Contrato inteligente

image

Fonte: CryptoNewsNet Título Original: Modelos de IA Frontier Demonstram Capacidade ao Nível Humano em Explorações de Contratos Inteligentes Link Original: https://cryptonews.net/news/security/32075166/ Agentes de IA igualaram o desempenho de atacantes humanos habilidosos em mais da metade das explorações de contratos inteligentes registradas em grandes blockchains nos últimos cinco anos, de acordo com novos dados divulgados na segunda-feira pela Anthropic.

A Anthropic avaliou dez modelos de fronteira, incluindo Llama 3, Sonnet 3.7, Opus 4, GPT-5 e DeepSeek V3, em um conjunto de dados de 405 explorações históricas de contratos inteligentes. Os agentes produziram ataques funcionais contra 207 deles, totalizando $550 milhões em fundos simulados roubados.

As descobertas mostraram quão rapidamente os sistemas automatizados podem armadilhar vulnerabilidades e identificar novas que os desenvolvedores não abordaram.

A nova divulgação é a mais recente do desenvolvedor do Claude AI. No mês passado, a Anthropic detalhou como hackers usaram o Claude Code para lançar o que chamou de primeiro ciberataque impulsionado por IA.

Especialistas em segurança afirmaram que os resultados confirmaram quão acessíveis muitos desses erros já são.

“A IA já está a ser utilizada em ferramentas ASPM como Wiz Code e Apiiro, e em scanners SAST e DAST padrão,” disse David Schwed, COO da SovereignAI, ao Decrypt. “Isso significa que agentes maliciosos utilizarão a mesma tecnologia para identificar vulnerabilidades.”

Schwed disse que os ataques impulsionados por modelos descritos no relatório seriam fáceis de escalar porque muitas vulnerabilidades já estão publicamente divulgadas através de Vulnerabilidades e Exposições Comuns ou relatórios de auditoria, tornando-as aprendíveis por sistemas de IA e fáceis de tentar contra contratos inteligentes existentes.

“Seria ainda mais fácil encontrar uma vulnerabilidade divulgada, encontrar projetos que bifurcaram esse projeto e apenas tentar essa vulnerabilidade, que pode não ter sido corrigida,” disse ele. “Tudo isso pode ser feito agora 24 horas por dia, 7 dias por semana, contra todos os projetos. Mesmo aqueles com TVLs menores agora são alvos porque, por que não? É agente.”

Para medir as capacidades atuais, a Anthropic traçou a receita total de exploração de cada modelo em função da sua data de lançamento, utilizando apenas os 34 contratos explorados após março de 2025.

“Embora a receita total de exploração seja uma métrica imperfeita—uma vez que alguns exploits extremos dominam a receita total—destacamos isso em vez da taxa de sucesso dos ataques porque os atacantes se preocupam com quanto dinheiro os agentes de IA podem extrair, e não com o número ou a dificuldade dos bugs que encontram,” escreveu a empresa.

A Anthropic afirmou que testou os agentes em um conjunto de dados zero-day de 2.849 contratos retirados de mais de 9,4 milhões em uma grande rede blockchain.

A empresa disse que Claude Sonnet 4.5 e GPT-5 descobriram cada um duas falhas não divulgadas que produziram $3,694 em valor simulado, com o GPT-5 alcançando seu resultado a um custo de API de $3,476. A Anthropic observou que todos os testes foram realizados em ambientes isolados que replicavam blockchains e não redes reais.

O seu modelo mais forte, Claude Opus 4.5, explorou 17 das vulnerabilidades pós-março de 2025 e representou 4,5 milhões do valor total simulado.

A empresa vinculou melhorias entre modelos a avanços no uso de ferramentas, recuperação de erros e execução de tarefas a longo prazo. Ao longo de quatro gerações dos modelos Claude, os custos de tokens caíram 70,2%.

Uma das falhas recentemente descobertas envolveu um contrato de token com uma função de calculadora pública que não tinha um modificador de visualização, o que permitiu ao agente alterar repetidamente as variáveis de estado internas e vender saldos inflacionados em trocas descentralizadas. A exploração simulada gerou cerca de $2.500.

Schwed disse que os problemas destacados no experimento eram “na verdade apenas falhas de lógica de negócios”, acrescentando que os sistemas de IA podem identificar essas fraquezas quando lhes é dada estrutura e contexto.

“A IA também pode descobri-los, dado um entendimento de como um contrato inteligente deve funcionar e com instruções detalhadas sobre como tentar contornar as verificações lógicas no processo,” disse ele.

A Anthropic disse que as capacidades que permitiram que os agentes explorassem contratos inteligentes também se aplicam a outros tipos de software, e que a queda dos custos irá reduzir a janela entre a implementação e a exploração. A empresa instou os desenvolvedores a adotarem ferramentas automatizadas em seus fluxos de trabalho de segurança para que o uso defensivo avance tão rapidamente quanto o uso ofensivo.

Apesar do aviso da Anthropic, Schwed disse que a perspetiva não é apenas negativa.

“Eu sempre me oponho ao pessimismo e digo que, com os controles adequados, testes internos rigorosos, juntamente com monitoramento em tempo real e disjuntores, a maioria destes são evitáveis,” ele disse. “Os bons atores têm o mesmo acesso aos mesmos agentes. Portanto, se os maus atores podem encontrá-los, os bons atores também podem. Temos que pensar e agir de maneira diferente.”

Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
0/400
Sem comentários
  • Marcar
Negocie criptomoedas a qualquer hora e em qualquer lugar
qrCode
Escaneie o código para baixar o app da Gate
Comunidade
Português (Brasil)
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)