01:39AI 编程工具 Cursor 发布 Composer 2 模型,性能超 Opus 4.6,价格降至前代 14%Cursor于3月20日发布了第三代编程模型Composer 2,价格大幅降至每百万token输入0.50美元、输出2.50美元,同时推出快速版。Composer 2在多项基准测试中表现优于前代,但低于GPT-5.4,提升主要源于对基座模型的继续预训练和强化学习。该模型仅供Cursor内部使用,母公司Anysphere估值达293亿美元。展开
00:02OpenAI 发布 GPT-5.4 mini 和 nano,定价最高达前代 4 倍行业报告OpenAI于3月18日发布了新模型GPT-5.4 mini和GPT-5.4 nano,针对多模态和编程场景,定价显著提高。GPT-5.4 mini在编程基准测试中表现优越,支持大规模上下文和多功能操作,此外,chatGPT免费版用户也将体验到新推理功能。展开
15:32乐天集团发布日语大模型Rakuten AI 3.0,因疑似基于DeepSeek架构引发争议行业报告乐天集团于3月17日推出日语特化大模型Rakuten AI 3.0,声称在多项日语测试中超越GPT-4o。然而,网友发现该模型可能基于DeepSeek开发,并对其立场偏向中国,以及自主研发技术的真实性提出质疑,引发讨论。展开
08:53乐天发布 Rakuten AI 3.0 模型,配置文件显示底层架构为 DeepSeek V3乐天集团于3月17日发布了名为Rakuten AI 3.0的高性能AI模型,参数达671B,针对日语进行了优化,声称在多项基准测试中超越了GPT-4o。该模型以Apache 2.0协议免费开源,基于DeepSeek V3模型微调而成,得到了日本政府的训练算力支持。展开
05:25Openclaw 发布 3.7 测试版,新增支持 GPT 5.4 和 Gemini Flash 3.1Gate News 消息,3 月 8 日,Openclaw 近日发布 3.7 测试版,主要更新为新增支持大语言模型 GPT 5.4 和 Gemini Flash 3.1。
03:23OpenClaw 创始人分享 AI 模型适配率排名,国产 minimax-m2.1 和 kimi-k2.5 分列 2、3 位OpenClaw创始人彼得·斯坦伯格分享了PinchBench的基准测试结果,显示Gemini 3 Flash在代理任务中以95.1%的成功率名列第一,国产模型minimax-m2.1和kimi-k2.5分列第二和第三,成功率为93.6%和93.4%。其它模型如Claude Sonnet 4.5和GPT-4o表现较低。展开
08:51OpenAI 推出 GPT-5.4 模型,支持 100 万上下文标记及原生计算机使用能力OpenAI于3月6日发布了GPT-5.4模型,提升了事实准确性和效率,采用更少token处理,响应更快。同时增强了深网研究的思维能力和上下文保留,支持用户在响应过程中打断并调整指令。该版本的引导功能已上线Android和网页端,iOS版本即将推出。展开
08:35OpenAI全面推出 GPT-5.4,专业企业与开发者迎来新一代AI工具OpenAI 发布了 GPT-5.4 模型,整合高级推理与编码功能,支持多种任务,并推出 Pro 版本针对企业需求。它拥有更大的上下文窗口,提高推理精度,错误率显著降低,经过多项专业测试表现优秀,开发者可通过 API 访问。展开
00:02OpenAI推出GPT-5.4,为最具事实性和最高效的模型OpenAI推出了GPT-5.4,强调其高效性和事实性。新模型在深网研究和上下文保留方面表现更佳,支持用户实时干预。引导功能已在多个平台上线,具备更强的计算能力和复杂任务处理能力。展开