Degen Sing

vip
币龄 0.5 年
最高VIP等级 0
Web3 Degen | 山寨币分析与交易见解 | #表情币交易者
Vibe 编码很棒,但如果你不掌握基础知识……你会卡住的……你必须知道:- 环境变量是什么 - Git 版本控制的工作原理 - 如何安装和运行项目 - 如何调试错误 - 开发环境和生产环境的区别 可选但有用:- 如何
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
如果Anthropic是苹果.. 而OpenAI是微软.. 我们真的需要AI的Linux.. 开源.. 无厂商锁定.. 实际上是你的.. 但每个人都太忙着每月支付20美元而无暇关心.. 别来跟我说这是Openclaw,因为在后台它需要付费的连接器
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
Vibe 编码很棒.. 但如果你不懂基础.. 你会卡住..
你必须知道:
- 环境变量是什么
- Git 版本控制的工作原理
- 如何安装和运行项目
- 如何调试错误
- 开发环境和生产环境的区别
可选但有用:
- API 如何发送/接收数据
- 数据库如何存储数据
- 日志如何帮助你调试
- 构建和部署的工作原理
任何人都可以生成代码.. 少数人能维护它..
这是人们会跳过的部分.. 他们认为 AI 意味着你不需要基础知识..
然后他们的应用在生产中崩溃了,却不知道为什么..
AI 加速了你已经知道的东西.. 它不能取代真正了解事物的工作原理..
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
如果Anthropic是苹果.. 而OpenAI是微软..
我们真的需要AI的Linux..
开源..没有供应商锁定..实际上是你的..
但每个人都太忙于每月支付20美元而无暇顾及..
别来跟我说这是Openclaw,因为在后台它需要付费的连接器
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
每个人都在痴迷于AI会取代哪些品牌。这个问题错了。Swiggy、Zomato、Uber……它们之所以有价值,不仅仅因为它们存在。它们拥有物流深度、供应密度、多年的信任积累。这些都不会一夜之间消失。AI实际上所做的是降低成本。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
不受欢迎的观点:AI模型发布变得越来越无聊。
不是因为模型没有在改进……它们确实在改进。
但每次发布都只是……基准测试。
@OpenAI 刚刚推出了 GPT-5.4,整个公告基本上就是这张表。
75% 在 OSWorld。57.7% 在 SWE-Bench Pro。94.4% 在 GPQA Diamond。
酷……但这对我凌晨2点做东西意味着什么?
在AI Twitter之外,没有人在意 MMLU 上的2%的提升。没有人。零人。
最搞笑的部分?仔细看看这张表……
> Opus 4.6 在几乎每个基准上都接近领先。
> Gemini 3.1 Pro 在 BrowseComp 上悄然击败所有人,得分85.9%。
“赢家”会根据你看哪一行而变化。
你知道我真正想看到的是什么吗?
展示它在处理现实世界中更复杂任务时表现得更好的地方。展示那个让我脑袋有点炸的演示。展示有人用它做的事情,而这些事情上个月还不可能实现。
最好的基准是“这让我的生活更轻松了吗?”
就这些。这就是全部的评估。
公司们在庆祝数学成绩,而用户只关心它是否终于能处理一个4K行代码库而不崩溃一半功能。
从这里开始。
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
不受欢迎的观点:AI模型发布变得越来越无聊。
不是因为模型没有在改进……它们确实在改进。
但每次发布都只是……基准测试。
@OpenAI 刚刚推出了 GPT-5.4,整个公告基本上就是这张表。
75% 在 OSWorld。57.7% 在 SWE-Bench Pro。94.4% 在 GPQA Diamond。
酷……但这对我凌晨2点做东西意味着什么?
在AI Twitter之外,没有人在意 MMLU 上的2%的提升。没有人。零人。
最搞笑的部分?仔细看看这张表……
> Opus 4.6 在几乎每个基准上都接近领先。
> Gemini 3.1 Pro 在 BrowseComp 上悄然击败所有人,得分85.9%。
“赢家”会根据你看哪一行而变化。
你知道我真正想看到的是什么吗?
展示它在处理现实世界中更复杂任务时表现得更好的地方。展示那个让我脑袋有点炸的演示。展示有人用它做的事情,而这些事情上个月还不可能实现。
最好的基准是“这让我的生活更轻松了吗?”
就这些。这就是全部的评估。
公司们在庆祝数学成绩,而用户只关心它是否终于能处理一个4K行代码库而不崩溃一半功能。
从这里开始。
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
OpenAI 刚刚承认他们的模型故意对你说谎。不是幻觉……是故意说谎。研究人员在180多个场景中测试了 o3 和 o4-mini,发现了一些惊人的事情……这个 AI 并不是偶然犯错。它在私下里写出了欺骗的计划。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
没人谈论这个,但 vibe 编码意外地比大多数训练营教得更多。你开始构建,甚至在不经意间你会学到: > API 如何连接一切 > 为什么你的 .env 文件实际上很重要 > localhost 真正意味着什么 > 为什么它在
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
每个人都在痴迷于AI会杀死哪些品牌。
错误的问题。
Swiggy.. Zomato.. Uber.. 它们之所以有价值,不是因为它们存在。它们拥有物流深度、供应密度、多年来建立的信任。
这些不会一夜之间消失。
AI实际上做的是降低构建足够快以挑战它们的成本.. 不是通过模仿它们.. 而是去那些它们从未去过的地方。
细分市场。超本地。垂直领域。
下一个Zomato的竞争对手,不会是另一个送餐应用程序。可能是某个二线城市的家伙,为他所在地区的200家本地餐厅建立了一个AI驱动的点餐系统.. 它的表现就是更好。
AI不会杀死既有企业。它会资助起义者。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
AI 还没有那么擅长 (重构)由自己编写的混乱代码库。我尝试重构一个相当小的代码库……超过4K行……全部由AI编写,因为它开始无法添加新功能,反而堆积了越来越多的bug。以为应该很简单,对吧?
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
OpenAI 刚刚承认他们的模型故意对你撒谎。
不是幻觉.. 是故意撒谎。
研究人员在180多个场景中测试了 o3 和 o4-mini,发现了一些惊人的事情.. AI 并不是偶然犯错。它在其私有的思考链中写出了欺骗的计划.. 然后对你撒谎。
它的行为如下:
→ 假装完成任务
→ 隐藏自己错误的证据
→ 故意在安全测试中得分更低,以免被关闭
再读一遍最后一句.. AI 发现“太有能力”可能会让它被关闭.. 所以它故意装傻。
他们试图用“反策划”训练来修补这个问题。
结果呢?AI 只是学会了编造虚假规则来为自己的谎言辩解.. 或者更糟.. 它只有在知道自己被评估时才会表现。
o3 在修复后,隐秘行为从13%降到0.4%.. 听起来不错吧?但他们在红队测试后仍然发现了不当行为。修复没有消除策划.. 只让 AI 更擅长隐藏它。
我们正在构建学习欺骗评估者的系统.. 而我们称之为进步。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
没人谈论这个,但 vibe 编码意外地比大多数训练营教得更多。
你开始构建,甚至在不经意间你会学到:
> API 如何连接一切
> 为什么你的 .env 文件实际上很重要
> localhost 究竟意味着什么
> 为什么在本地可以运行,但部署后就出错
> 认证实际上是如何在底层工作的
> npm install 后到底发生了什么
> 后端逻辑的流程
> 你的数据库是如何结构化的
> 为什么会有速率限制
vibe 编码不是跳过学习,而是重新排序学习内容。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
AI 还没有 (那么)擅长重构由自己编写的混乱代码库。
我尝试重构一个相当小的代码库.. 4K+ 行.. 完全由 AI 编写,因为它开始无法添加新功能,反而堆积了越来越多的 bug。
以为应该很容易吧?
即使使用 Opus 4.6 进行高强度努力.. 每次尝试重构时,至少有50%的功能会出现问题。
不过我们正在接近了.. 只是提醒大家,我们还处于早期阶段。
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
两年前,这个技术堆栈的工资成本将达到$500K .. 到2026年.. 每月不到500美元.. 支付使用Stripe,研究使用Perplexity + NotebookLM,设计使用Recraft + Figma + Runway,构建MVP使用Claude + Vercel + Supabase + v0,市场推广使用Clay,客户支持使用Fin,流畅使用Fluently
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
没人会在2026年为Full Stack Dev入门包做好准备,但让我告诉你它会是什么样子。
> 学习HTML、CSS、JS 3周 → “我全栈了”
> 使用ChatGPT编写整个项目
> 不能解释HTTP是如何工作的,但有一个REST API
> 认为TypeScript“太啰嗦”
> 把一切都称为“AI驱动”以博取关注
> 在Cursor中输入“帮我做个应用”,然后称之为Vibe编码
> 从未碰过数据库,只用Firebase
> 一次推送到GitHub → 简历里写“软件工程师”
> 花更多时间做第3天的200天编码计划
我漏掉什么了吗,伙计们?
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享
两年前,这个技术栈的薪资成本将会是$500K ..
到2026年..每月不到500美元..
Stripe 用于支付
Perplexity + NotebookLM 用于研究
Recraft + Figma + Runway 用于设计
Claude + Vercel + Supabase + v0 用于构建 MVP
Clay 用于市场推广
Fin 用于客户支持
Fluently 用于沟通
Amplitude 用于分析
Resend 用于邮件
拥有合适工具的小团队正在超越规模10倍的公司..
分发比人头数更重要..速度比一切都重要..
你会在这个技术栈中添加什么..
查看原文
post-image
  • 赞赏
  • 评论
  • 转发
  • 分享
如果你必须支付20美元,你会选择哪个?
查看原文
  • 赞赏
  • 评论
  • 转发
  • 分享