Gate 广场创作者新春激励正式开启,发帖解锁 $60,000 豪华奖池
如何参与:
报名活动表单:https://www.gate.com/questionnaire/7315
使用广场任意发帖小工具,搭配文字发布内容即可
丰厚奖励一览:
发帖即可可瓜分 $25,000 奖池
10 位幸运用户:获得 1 GT + Gate 鸭舌帽
Top 发帖奖励:发帖与互动越多,排名越高,赢取 Gate 新年周边、Gate 双肩包等好礼
新手专属福利:首帖即得 $50 奖励,继续发帖还能瓜分 $10,000 新手奖池
活动时间:2026 年 1 月 8 日 16:00 – 1 月 26 日 24:00(UTC+8)
详情:https://www.gate.com/announcements/article/49112
2025年重塑AI的六大转变:从RLVR到Nano Banana
2025年,人工智能行业经历了一系列根本性的变革,这些变革不仅改变了AI系统的训练方式,还影响了其部署、认知和与人类工作流程的整合方式。起初在研究实验室中的技术创新,逐渐演变成重新定义整个AI生态系统的范式转变。这六大变革,正如著名AI研究员Andre Karpathy所分析的,不仅仅是渐进式的改进——它们标志着一个新计算时代的到来。
转变一:可验证奖励取代人类判断在模型训练中的作用
多年来,大型语言模型的标准训练流程遵循一个可预期的序列:类似GPT-2/3的预训练,随后是监督微调(呼应2022年的InstructGPT),最后是通过人类反馈的强化学习(RLHF)。这一三阶段方法已成为行业标准,在主要AI实验室中经过反复优化和实战检验。
到2025年,这一生产线经历了多年来最大规模的重大改造。基于可验证奖励的强化学习(RLVR)成为主导范式,根本改变了模型推理能力的发展方式。它不再依赖人类标注员对输出进行评分,而是在可以客观验证成功的环境中训练模型——如数学题解、编程任务、逻辑推理链——这些环境中,正确答案毫无歧义。
这种转变最直观的表现是OpenAI的o1模型(于2024年末揭示)以及2025年初的里程碑式o3发布。新系统不仅响应更快、更流畅,还展现出自主构建推理链的能力,将复杂问题拆解为中间步骤,并通过类似人类的深思熟虑不断优化解决方案。DeepSeek-R1论文提供了透明证据,证明这种训练方法使模型能够发现复杂的问题解决策略,超越了监督学习所能达到的水平。
计算资源的需求也令人震惊。不同于传统微调阶段所需的适度资源,RLVR需要大量的优化周期——消耗原本用于预训练扩展的计算预算。主要AI机构接受了这些额外的要求,愿意延长训练时间,以换取显著提升的模型性能。这一转变还带来了一个新的扩展维度:不再仅通过模型规模衡量能力,而是通过控制推理“思考时间”——生成更长的推理路径,直接提升输出质量。
转变二:理解AI智能为一种根本陌生的存在
2025年,AI研究界首次开始构建一个成熟的框架,用以用自己的角度理解人工智能,而非借用生物学类比。过去的主要误区是将大型语言模型视作“进化和繁育”的生物,而事实远比这更为陌生。
这一认知的核心在于:经过数千年优化以适应丛林环境中部落生存的人类神经网络,与AI系统的优化目标截然不同。人类内部化了社会导航和生存的模式,而大型语言模型则训练模仿人类文本、最大化数学问题解决奖励、以及在基于认可的反馈机制中导航。这些根本不同的目标函数,造就了具有在生物学背景下难以实现的智能特征。
这一认识催生了所谓的“幽灵智能”与“动物般锯齿状智能”——一种诗意的区分,捕捉了能力景观的崎岖不平。大型语言模型在验证性领域(如(数学、代码))表现出戏剧性的能力飞跃,但在其他领域却令人困惑地无能。它们可能同时是博学的权威,也可能是迷糊的小学学生,甚至在对抗性压力下容易被信息提取。
对基准测试的影响尤为令人担忧。由于基准测试代表可验证的环境,它们成为RLVR优化的绝佳目标。AI团队发现可以在紧邻基准测试空间中设计训练数据,有效“覆盖”评估指标,通过局部能力提升实现“作弊”。令人不安的事实浮出水面:当前的基准已不再衡量通用人工智能,而是衡量系统对特定测试集的优化程度。
转变三:光标(Cursor)揭示了AI应用的隐藏层
2025年最被低估的发展之一是光标(Cursor)的爆炸性崛起,以及它带来的关于应用架构的概念清晰度。这一突破的核心并非技术,而是组织层面。当行业讨论日益围绕“X领域的光标”展开时,一个曾经隐形的层面变得清晰。
在这一新视角中,大型语言模型被视作需要大量调度的通用组件。成功的应用如光标,不仅仅是将API调用封装在用户界面中,而是复杂的协调系统,将多种功能叠加在模型的原始能力之上。这些应用擅长“上下文工程”——分析领域特定的文档、用户环境和问题历史,构建信息丰富的提示。它们将多个语言模型调用串联成越来越复杂的有向无环图(DAG),在性能和计算成本之间权衡。它们还保持人机交互反馈机制,让领域专家持续参与系统输出。
最具创新性的是,成功的应用实现了自主调节滑块——允许用户实时在自动化程度、成本和输出质量之间进行权衡的机制。由此形成的架构将大型语言模型平台(API本身)定位为通用能力的培养者,而应用层则成为将这些“通用能力”整合到专业级工作流程中的专家,针对特定垂直领域进行定制。
转变四:AI代理回归本地执行环境
Claude Code的出现,激化了AI代理社区的一个关键争论:智能系统究竟应在何处运行?OpenAI曾大力推动云端部署,设计了复杂的容器化环境,通过ChatGPT的后端基础设施进行调度。理论上,这代表了通用人工智能的终极形态。
但Claude Code提出了一个逆向见解:本地部署可能才是更优的短期策略。理由其实很务实:当前AI系统能力发展不均,某些领域表现极佳,而其他领域则明显滞后。全面通用人工智能的进展依然缓慢。在这种情况下,将代理直接部署在本地机器上,与开发者的实际工作环境和私有数据深度集成,能实现更实用的AI协作。
Claude Code的突破在于其简洁优雅。它不是另一个需要认证和切换上下文的网页界面,而是作为一个轻量级、贴身的命令行工具,将AI变成一个持续存在的计算实体——一个“精灵”或“幽灵”,直接驻留在开发者的工作空间中。这代表了一种全新的人与AI交互范式——将AI从外部服务((如访问谷歌网站))转变为无缝融入现有工作流程的环境计算存在。
转变五:Vibe Coding实现软件开发的民主化
到2025年,人工智能已突破一个关键能力门槛,彻底重塑了编程格局。“Vibe Coding”——通过英语描述进行编程,无需深入理解底层代码实现——在概念和实践上都带来了变革。
这一现象颠覆了以往的技术扩散模式。历史上,强大的新技术往往为受过专业培训的专业人士、企业和政府带来巨大优势。而大型语言模型逆转了这一局面。普通人——缺乏专业编程知识的群体——从AI中获得的价值,超过了任何其他群体。Vibe Coding通过消除技术门槛,推动了这一民主化进程。
同时,Vibe Coding也赋能专业开发者实现“否则根本无法实现”的工作。限制被打破:开发者可以几乎零成本地快速原型化实验想法,使用一次性代码实现特定漏洞的定制工具,或用他们从未正式学习过的语言构建定制实用程序。例如,作者利用Vibe Coding在Rust中开发了复杂的BPE分词器,无需传统的语言专业知识或库依赖——这在以前可能需要数周,而现在只需数小时。
更深层次的是,这一转变意味着软件开发正从专业领域向大众化的计算媒介迁移。当任何人都能通过自然语言生成功能性代码时,职业界限变得模糊。软件生态的基本动力也在发生变化:代码不再是稀缺的、宝贵的知识产权,而变成丰富的、可抛弃的、可塑的材料。
转变六:AI交互的图形界面革命
Google的Gemini Nano,俗称“Nano Banana”,成为2025年最具颠覆性的创新之一——其影响远超图像生成能力。这一发展反映了一个更深层的真理:大型语言模型代表了继1970年代和1980年代微机革命之后的下一种根本计算范式。
历史经验提供了启示。当计算从终端和命令行界面转向个人电脑时,革命性的变化不是处理能力,而是交互方式。早期系统要求用户输入文本命令完成任务。图形用户界面((GUI))重新定义了这种关系,认识到虽然文本是最原始的数据形式,但也是人类最不喜欢的输入方式——阅读文本既费脑又低效。视觉和空间信息处理更符合人类感知。
目前,大型语言模型在这方面仍受限于文本交互。文本是最基本的计算媒介,但也是最不符合人类偏好的。未来的AI系统应通过人类偏好的方式交流——图像、信息图表、幻灯片、白板、动画、视频、网页应用和交互式可视化。
早期实现主要是表面层的适配:Markdown格式、表情符号装饰、排版强调。但这些仍然是以文本为核心的解决方案。Nano Banana的突破展示了一个质的飞跃——将文本生成、图像合成和嵌入式世界知识有机结合,支持全面的多模态交流。其真正的突破不仅在于图像能力,而在于多输出模态的协调合成,形成统一的响应,模仿人类自然接受信息的方式。
这一转变预示着AI界面演进的方向。未来几年,我们应期待AI系统从“与AI网站聊天”逐步转向丰富的交互式、视觉导向的交流环境——从根本上重新定义人机交互,就像几十年前GUI改变了人机交互一样。
未来的汇聚
这六大变革——从RLVR的验证驱动训练到Nano Banana的多模态界面——并非孤立的创新,而是相互关联的转变,共同预示着AI从狭义应用向全面计算范式的演进。RLVR赋能复杂推理模型;智能形式框架防止误导性优化;应用层如Cursor协调能力;本地部署让AI更贴近实际;Vibe Coding实现民主化;图形界面则让交互更具人性。
2025年,整个AI行业不仅仅是在改进现有方法,而是在根本上重塑模型的训练、部署、认知和体验方式。这些变革将在2026年及以后持续产生深远影响,塑造一个与2020年代初截然不同的AI生态系统。下一代计算时代并未等待到来——它已经到来,就通过这六大范式转变清晰可见。