企业 Agent 落地:一场从概念到工程的漫长渡劫
上周和一个做企业软件的工程师聊天,他说现在出去开会,展位上全是"Agent 平台",名字多到记不住。这话让我想起十年前的"千团大战",历史总是押韵——只是这次卷的不是补贴,而是谁能真正把 Agent 跑在生产环境里。
战国时代:热闹与虚妄
中国市场目前大约有三十款打着"企业 Agent 平台"旗号的产品,腾讯、阿里、百度、字节、智谱、MiniMax 悉数入场。业内人士戏称"百虾大战",但凡事总有代价。
这些平台解决了什么?聊天机器人、文档总结、自动回复—— demo 演示无比丝滑。但一旦涉及企业核心场景,权限边界在哪里?审计日志怎么打?成本如何分摊到具体业务线?跨部门角色如何管理?这些问题像地雷一样埋在平台底层。
更深层的矛盾在于:企业治理要求透明、可追溯、合规,而 Agent 的本质是"不确定输出"。这两个目标之间存在根本张力。一款在个人工具市场表现优秀的产品,拿到企业环境可能水土不服,因为企业要的不是"能用",而是"出事能查、越权能拦、花费能算"。
所以第一波 Agent 浪潮更像是"玩具化验证"——大家都在 POC(概念验证),真正能 scale 到千人规模企业的案例少之又少。
AI 编程:临界点已过,瓶颈转移
一个值得注意的信号来自开发者社区的反馈:有人直言 AI"几乎所有编程任务都比我强,缺陷率低到非人类"。这话听着像自谦,但如果你仔细看背后的逻辑,会发现这不是技术崇拜,而是实打实的效率描述。
当 AI 能稳定输出可用代码时,瓶颈从"写代码"转移到了另一个更棘手的问题——Steering Problem:如何让 AI 真正理解你想要什么。
这不是 prompt 工程那么简单。真正的难题是:如何把业务需求转化为精确的技术指令,如何在 AI 输出的海洋里识别出偏离目标的碎片,如何构建一个人类和 AI 协作的反馈闭环。这个问题没有银弹,每个团队都在摸索自己的解法。
值得注意的是,真正可用的模型能力基本都来自付费服务,开源权重模型在企业级场景下的评价往往是"玩具"——不是因为开源模型不好,而是因为企业需要的那套稳定性、安全性、合规性,免费的餐食给不了。
RAG 工程:那些没人告诉你的坑
如果说 Agent 平台是战场上的明枪,那 RAG(检索增强生成)就是埋在后勤线上的暗雷。
最近看到一篇来自一线的工程复盘,讲述一个多租户 RAG 聊天机器人落地 500 多家企业的血泪史。几个细节特别有意思:
PDF 预处理是个隐形炸弹。约 30% 的扫描版 PDF 没有文字层,依赖底层 OCR 引擎,而这些 OCR 质量参差不齐。一旦 OCR 失败,后面所有检索都是空中楼阁。
页眉页脚的诅咒。“Confidential"“内部资料"“第 X 页"这些在人类眼里是噪音,但在 chunk 切分时会被原封不动地埋进向量数据库。一份 200 页的文档,可能有几十个 chunk 都包含"Confidential”,检索结果被严重污染。
“伪并行"管道的真实成本。表面上并行处理提升了吞吐量,但当系统处于高负载时,p50 延迟会增加 200ms 以上。用户感知到的不是"系统很快”,而是"有时候快有时候慢”——这种不确定性在企业场景里比慢更致命。
教训很残酷:预处理是 RAG 系统里最无聊的环节,却是最容易出灾难性问题的环节。多数团队把资源砸在模型调优上,而真正的瓶颈往往在数据清洗。
Skills 资产化:竞争新维度
如果说 2023-2024 年大家在卷模型能力,2025 年的竞争焦点已经悄悄转移到了另一个维度——Skills 积累。
所谓 Skills,可以理解为 AI Agent 的工具箱和能力单元。一个客服 Agent 有多少可复用的 Skills 决定了它能处理多少场景,一个代码审查 Agent 的 Skills 库深度决定了它能否替代初级工程师的工作。
在 AI Native 时代,企业的竞争优势不再取决于人头数,而是 Skills 积累的深度和广度。系统架构随之演进:更精简的核心、更强的模型底座、以 Agent 为中心的新一代工程范式——有人称之为"Harness 工程”,意思是把模型能力"套牢"在可复用的 Skills 资产里。
这个趋势带来的直接影响是:技术债务的形态变了。以前是代码腐烂,现在是 Skills 重复造轮子。一家没有 Skills 资产积累的企业,每次新场景都要从零开始调试 prompt,而另一家有丰富 Skills 库的企业,可能只需要组合几个现有模块。
单人公司崛起:职业形态的重新定义
最让我感慨的是一种新兴组织形态——OPC(One-Person Company,一人公司)。
几个关键变量正在同步成熟:AI Native 工具降低了单人操作复杂系统的门槛,强 Skills 积累让个人能承接以前需要一个团队才能完成的工作,模型能力的提升让"一个人编排 AI agent 团队"变得现实。
有人在社区里分享,说自己离开了工作二十年的雇主,转型做"编排 AI agent 团队"的活。不是写代码,是设计流程、定义边界、处理边缘case。这种转变的底层逻辑很有意思:当编程变得足够廉价,只有富人才会手写代码。
这话说得有点绝对,但方向是对的。未来技术工作的价值会重新分配——不再是你写了多少行代码,而是你能否驾驭一个由 AI agents 组成的协作网络。这需要的技能组合和十年前完全不同:系统设计能力、流程抽象能力、对 AI 边界的直觉判断。
结语
这波 Agent 浪潮和以往的技术周期有些不同——它不是在解决一个全新的问题,而是把之前"理论上可行但成本太高"的场景用一种更便宜的方式重新做了一遍。
但便宜不等于简单。企业在落地时发现,治理、成本、可追溯性这些老问题并没有因为用了 AI 就消失,只是换了一层皮。工程化的难度被低估了,而那些在 POC 阶段被忽略的细节,往往是生产环境的命门。
对技术从业者来说,这可能是一个重新校准期待的时机:Agent 不是银弹,但确实是杠杆。关键在于你用它撬什么,以及你有没有足够的工程能力让它稳定运行。
综合了 Dev.to 社区的工程实践复盘、Lobste.rs 上开发者的一线观察,以及近期企业 Agent 市场的格局分析。