全球 AI 行业大模型与监管动态

追踪 OpenAI、Anthropic、Google、DeepSeek 等大模型发布、融资与监管事件;含纯 AI 行业热点,不局限于加密,但影响市场情绪与叙事。
ALLAI AgentAI 行业动态AI 代币AI 工具应用

Cursor 揭选 XAI 訓练原因:算力被卡住,SpaceX 另握 600 亿美元收购期权

Anysphere 公告称 Cursor 将与 xAI 使用 Colossus 基础设施训练新模型以突破算力瓶颈;SpaceX 提出 600 亿美元的收购选择权(2026 年内可整体收购),不行就支付约 100 亿美元作为合作补偿。两笔交易同时进行,重塑谁能训练 Cursor 以及谁能买下 Cursor,Cursor 仍允许多模型后端,但长期走向取决于 SpaceX 是否行使收购权。
XAI1.76%
鏈新聞abmedia·6 分钟前

Anthropic 二级市场估值突破 1 万亿美元:Forge Global 反超 OpenAI 的 8,800 亿

根据 Decrypt 报道,Forge Global 的 Anthropic 二级估值约 1 兆美元,OpenAI 约 8,800 亿美元,二级市场首次出现领先逆转。Anthropic ARR 由 2025 底的约 90 亿增至 2026 年 3 月约 300 亿,三个 在 233%,推动私募估值。二级估值与一级融资不同,反映退出信心;未来仍看技术、政策、商业与叙事四条渠道。
鏈新聞abmedia·7 分钟前

川普政府公布打击 AI 提炼计划,控中企系统性窃取模型能力

白宫科技政策办公室(OSTP)总统助理迈克尔·J·克拉齐奥斯(Michael J. Kratsios)于 4 月 23 日发布官方声明,表示特朗普政府掌握信息,显示外国实体(主要位于中国)正在蓄意针对美国大型人工智能公司,通过“数万个代理账户”及越狱技术系统性提取美国 AI 模型能力,并同步公布四项应对措施。
Market Whisper·1小时前
news-image

腾讯开源 Hy3 预览版,代码基准测试较前代提升 40%

腾讯于 4 月 23 日在 GitHub、Hugging Face 及 ModelScope 平台正式开源 Hy3 预览版大型语言模型,并同步于腾讯云端(Tencent Cloud)提供付费 API 服务。据 Decrypt 于 4 月 24 日报道,Hy3 预览版自 1 月下旬启动训练,截至发布时间历时不足三个月。
Market Whisper·2小时前
news-image

小米披露 MiMo-V2-Pro 训练细节:1T 模型参数,部署成千上万台 GPU

Gate News 消息,4月24日——小米的大语言模型团队负责人罗福丽在一场深入采访中透露,MiMo-V2-Pro 模型的总参数量达到 1 万亿,并且训练过程中需要成千上万台 GPU。她表示,1T 规模代表要实现接近 Claude Opus 4.6 等级的性能,并为下一阶段 AI 智能体抢占具备竞争力的入场券所达到的最低门槛
GateNews·2小时前

DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。 在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover 35.50、Gemini 3 Pro 26.50 和 Seed-1.5-Prover 26.50。前沿模式的结果显示,V4 在 Seed-1.5-Prover 110/120 与 Aristotle 100/120 之前。 V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。
GateNews·2小时前

SK Hynix一季度利润因AI繁荣实现五倍飙升并创纪录,员工奖金增至878K

Gate News 消息,4月24日——SK Hynix报告称,截至4月23日,其季度经营利润实现五倍增长,创下纪录,达到37.61万亿韩元 ($32.4 billion),主要受益于来自人工智能和数据中心的需求暴涨。该意外之财正在推动前所未有的员工奖金,分析师预计该奖金可能在2027年每位员工最高达到$878,000,若当前盈利预
GateNews·3小时前

DeepSeek V4 训练数据翻倍至 33T,导致不稳定性并延迟了发布

Gate News 消息,4月24日——DeepSeek 的 V4 技术报告显示,V4-Flash 和 V4-Pro 分别在 32T 和 33T token 上进行了预训练,相较于 V3 使用的约 15T token 翻了一倍。该报告承认在训练过程中遇到了“显著的不稳定性挑战”,损失尖峰反复出现,是由于 Mixture-of-Experts MoE 层中的异常;路由机制本身会加剧这些异常,而简单的回滚也无法解决问题。
GateNews·4小时前