コインワールドの報道によると、Anthropic は、同社の研究者が自作の SCONE-bench ベンチマーク(2020年から2025年までの405の実際に攻撃された契約を含む)で Claude Opus 4.5、Claude Sonnet 4.5、GPT-5 モデルをテストした結果を発表しました。知識更新日(2025年3月)以降に攻撃された契約の中で、3つのモデルは合計約460万ドルの利用可能な脆弱性を発見しました。さらに、2849の最近展開された既知の脆弱性のない契約に対するシミュレーションテストでは、Sonnet 4.5 と GPT-5 がそれぞれ2つの新しいゼロデイ脆弱性を発見し、合計で3694ドルの損失を引き起こしました。そのうち、GPT-5 の API コストは3476ドルです。
Anthropic:AI エージェントが実際の契約で460万ドルの脆弱性を発見
コインワールドの報道によると、Anthropic は、同社の研究者が自作の SCONE-bench ベンチマーク(2020年から2025年までの405の実際に攻撃された契約を含む)で Claude Opus 4.5、Claude Sonnet 4.5、GPT-5 モデルをテストした結果を発表しました。知識更新日(2025年3月)以降に攻撃された契約の中で、3つのモデルは合計約460万ドルの利用可能な脆弱性を発見しました。さらに、2849の最近展開された既知の脆弱性のない契約に対するシミュレーションテストでは、Sonnet 4.5 と GPT-5 がそれぞれ2つの新しいゼロデイ脆弱性を発見し、合計で3694ドルの損失を引き起こしました。そのうち、GPT-5 の API コストは3476ドルです。