Posts
是时候考虑多 Agent 安全了
DeepMind 1000 万美元建"多 Agent 安全"学科,Shah 说这块地图在他们出手之前是白的——AGI 可能来自蜂巢而非单体模型,护栏是为对话设计的,代理是行动。
继续阅读Posts
当代码变成 Token:开发者的技能曲线正在塌方
腾讯编码提速 40% 但整体只提 20%,arxiv 实测重度 AI 用户表现反退——AI 加速的只是 20% 的环节,剩下 80% 没人提。技能曲线在塌方,但不是因为 AI 太强,是因为尺子没跟上。
继续阅读Posts
继续阅读
AI两重天:Claude编程狂飙与自动驾驶的困局
2026年的硅谷,两个AI故事正在同时展开,结局却天差地别。
一边是Claude Code——Anthropic出品的AI编程工具——正在以惊人的速度迭代。从7层记忆架构到Rules/MCP/Skills三件套,编程边界被不断突破。代码能力的进步,几乎是每月一个样。
另一边是Waymo——Google耗资数十亿美元打造的自动驾驶业务——在规模化面前撞上了真实的墙。“growing pains as autonomous vehicles scale”,SED News这句描述轻描淡写,背后是监管博弈、物理世界的长尾风险、传感器成本,和一个无法靠数据飞轮绕过的现实。
两个项目,都背靠顶级资源和AI人才,都基于相似的深度学习范式,为什么走向完全不同的结局?
Posts
AI安全的两难:政策逼着证明安全,技术却拿不出证据
政策要求高风险AI提供可量化安全证明,但既无度量衡也无标准。Internal Safety Collapse让95%以上的安全测试失效,SafeRedirect通过"有尊严地失败"将失效率压至8%。技术改善与监管证明之间,横亘着一条尚未被跨越的鸿沟。
继续阅读Posts
Agent时代启示录:To Agent正在重写经济系统的底层逻辑
Anthropic 的 DAU 仅为 ChatGPT 的 2%,但两家 ARR 已追平。这不是逆袭,是旧度量衡失效的信号。当 Agent 同时成为生产者和消费者,一个从未出现过的主角登上了经济舞台。
继续阅读Posts
继续阅读
算力战国:AI芯片格局与淘汰赛
2026年Q1,一组数据给火热的AI芯片赛道泼了一盆冷水:全球135家投身AI处理器研发的企业,其中99家是初创公司。而权威机构JPR的预测冰冷而直接——到2030年,这个数字将锐减至约25家。
从135到25,这场淘汰赛已经鸣枪。
Posts
AI 原生业务流程:从 x402 协议看 AI 时代的流程重构
以 x402 协议为解剖样本,探讨 AI 原生业务流程的本质特征与重构逻辑,提出意图驱动、破除断点、人机协作、能力飞轮四维设计框架。
继续阅读