"MAX"的搜索结果
今天
04:49

DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。 在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover 35.50、Gemini 3 Pro 26.50 和 Seed-1.5-Prover 26.50。前沿模式的结果显示,V4 在 Seed-1.5-Prover 110/120 与 Aristotle 100/120 之前。 V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。
展开
04:21

Claude 桌面端上线 Dispatch 功能:手机派活,电脑执行

Anthropic 在 Claude 桌面端推出新功能 Dispatch,用户可通过手机指令让 Claude 在电脑上执行任务。该功能需用户确认每个操作,现仅对 Max 订阅用户开放,Pro 用户将很快获得权限。测试显示速度较慢,任务成功率约五成。
展开
04:57

Claude 推出非高峰时段配额加倍优惠,活动持续至 3 月 27 日

Gate News 消息,3 月 15 日,Claude 宣布从 3 月 13 日至 27 日,为免费、Pro、Max 和 Team 计划用户提供使用量配额加倍优惠。优惠在非高峰期自动生效,非高峰期定义为每个工作日太平洋时间上午 5 点至 11 点(格林威治标准时间中午 12 点至下午 6 点)以外的时段,以及周末全天。Claude 表示,此举旨在奖励用户并优化系统负载。
00:49

OpenAI推理模型核心研究员转投Anthropic

OpenAI核心研究员Max Schwarzer宣布离职,加入Anthropic,将专注于强化学习研究。他曾参与o1和o3的后训练,并领导后训练团队交付多款GPT产品。
展开