2026-04-08 14:32:30

Anthropic 的新模型在一个基准测试中将 Opus 4.6 的表现翻了一番 Claude Mythos 预览 — 仅限邀请，无公开API。他们的系统卡片中的数据： - SWE-bench 认证：93.9% 对比 80.8% (Opus) 对比 79.6% (Sonnet) - SWE-bench 专业版：77.8% 对比 53.4% - Terminal-Bench 2.0：82.0% 对比 65.4% -

查看原文

此页面可能包含第三方内容，仅供参考（非陈述/保证），不应被视为 Gate 认可其观点表述，也不得被视为财务或专业建议。详见声明。

赞赏
点赞
评论
转发
分享

评论

请输入评论内容

请输入评论内容

暂无评论

热门话题
查看更多
#
Gate上线Pre-IPOs
97.38万热度
#
Gate现货衍生品双双冲进全球前三
965.71万热度
#
原油小幅上涨
123.6万热度
#
美伊停火协议谈判再生变故
60.19万热度
#
加密市场回升
6.54万热度

热门 Gate Fun
查看更多

1
CEA
Creator Empowerment Allia
市值:$2272.41持有人数:1
0.00%
2
leopard
Laughing leopard
市值:$2268.96持有人数:1
0.00%
3
Ottmn
OttomanEmpire
市值:$2547.37持有人数:2
0.00%
4
XGYF
云锋
市值:$2329.49持有人数:1
0.81%
5
RB
钱多多
市值:$0.1持有人数:1
0.00%