AI 原生的企业组织形式畅想
一家公司最贵的不是工资,是决策。
接下来 12 个月,最值得观察的也不是哪家模型又刷了榜——而是哪家公司的决策权,悄悄从人手里交到了系统里。
一、错的问题:“AI 提效 20%”
一年前大家聊"AI 时代公司怎么变",答案通常是:让工程师多写 20% 代码,让销售多打 20% 电话,让运营多处理 20% 工单。
YC 的 Tom Blomfield 给这个思路判了死刑 [2]:
这就好比给一种老旧的工作方式装上更强劲的引擎。真正值得深思的,并不是如何给旧组织中添加一个 AI 工具,而是重新构想公司本身究竟是什么,以及它应当如何运作。
他举了一个细节 [2]:他坚信团队里那个叫 Garry 的工程师,现在一个人写出的代码比整个工程团队还多。如果这是真的——当 1 个工程师的产出 ≈ 整个团队,所谓的"提效"就不再是"省人",而是"换形态"。
提效的天花板不是"省 20% 时间",是"公司是什么"被重新打开。
这个被打开的入口,是决策权。
二、AI 原生公司的定义:决策的主体变了
AI 原生公司不是"一家用 AI 的公司"。它的特征是决策的主体从人迁移到系统。
传统公司,决策在层级里发生:CEO 拍板 → VP 解读 → Manager 分配 → IC 执行。每一步都需要人当传话筒,每一步都会失真。
AI 原生公司里,决策在循环里发生:
传感器层 → 策略/决策层 → 工具层 → 质量关卡 → 学习机制
(邮件/工单/遥测) (规则) (确定性API) (高风险检查) (反馈回起点)这 5 层是 Tom 提的([2])。但我读完 30 多篇材料后,真正想强调的不是"5 层"这个具体架构,而是它背后那件事:
决策可以脱离人独立运行。人在循环里,但不再是"传话筒",而是"反馈环"和"异常干预者"。
Anthropic 内部那个"自动改 PR"的 Agent 不是炫技 [2][3]:
- 监控系统看哪个查询失败
- 判断是不是缺工具
- 写代码、提 PR
- 另一个 Agent 审查、合并、部署
- 第二天查询就能用
这中间没有人做决策。系统在做。人在做的只是:当系统卡住时拍板。
纳德拉把这个新形态叫"爬山机器" [1]:
这个循环将成为公司新的知识产权。它具有复利效应:每一次工作流的改进都会产生更好的训练信号,加速公司独有的隐性知识积累。
罗马军团用纪律维持秩序。爬山机器用复利积累知识。两种逻辑、两种公司——但根本区别不在技术,在决策权在谁手里。
三、决策权迁移会带出 3 个相互关联的位移
决策权一动,剩下的一切都被拖动。这是我自己的判断,不是某个 CEO 说的,但每条都有人在做、有人踩过坑。
位移 1:决策权位移 —— 从人到系统
不抽象,看一个具体例子。
传统客服:
- 用户发工单
- 客服读工单 → 判断问题类型 → 查知识库 → 写回复
- 主管 review 回复质量
AI 原生客服:
- 用户发工单
- Agent 读工单 → 查知识库 → 调用 LLM 生成回复
- 质量关卡(确定性检查 + 风险过滤器 + 高风险人工 review)
- 客户回复"不解决问题"→ Agent 自动升级到人工
- “不解决问题"的工单 → 自动汇总到产品 backlog
- 相似工单出现第 3 次 → Agent 自动写 FAQ
关键差别:每一步决策的主体不同。前者人,后者系统。人没有消失,但人退到了"反馈环"和"异常干预"的位置。
这就是"5 层架构"在客服场景里的具体化——但它不是 5 步流程,是一个自我修正的循环。
位移 2:角色位移 —— 从"决策者"到"反馈环”
既然决策权移了,角色的本质就变了。
Anthropic 的工程负责人说 [4]:
中层管理时代结束了。
这话听着像管理学口号,但配合 Tom 的两个角色定义 [2] 就清楚了:
未来公司只靠两个角色运转:IC(独立贡献者)+ DRI(直接责任人)。
DRI 不是传统意义的"决策者"。DRI 是反馈环的接口人——当系统卡住时拍板、当系统出错时纠偏、当系统的判断标准过时了重新定义标准。
DRI 不是少做事了,是做的事完全变了:从"做决策"变成"训练决策系统"。
我自己的判断:DRI 的能力门槛反而提高了。只有资深 IC 才有资格做 DRI——因为他要判断系统"卡得对不对",这件事本身就需要业务深度。
位移 3:经济学位移 —— 从"人头 × 时薪"到"Token × 知识密度"
YC 的统计 [2]:Demo Day 公司的"人均营收"在过去 18 个月涨了约 5 倍。Tom 预言这个趋势会蔓延。
传统公司经济学:
- 收入 ≈ 人数 × 人均产出
- 成本 ≈ 人数 × 时薪
- 利润 = 收入 - 成本(人数是核心变量)
AI 原生公司经济学:
- 收入 ≈ 决策循环数 × 每次循环的价值
- 成本 ≈ Token 消耗 + 知识沉淀成本
- 利润取决于Token 利用密度和知识复利速度
真正的制约因素将不再是员工人数,而是 Token 的使用量、业务上下文质量、组织知识的可读性。 [2]
这条位移对所有公司都是地震级——员工数不再是"成功指标",反而可能是"复杂度税"。
凡是被记录下来的,对 AI 而言都确有其事;凡是没有被记录的,对你的 AI 而言就根本没发生过。 [2]
知识密度才是新护城河。
四、清醒的一面:80% 的 AI 转型为什么失败
三个位移在理论上顺,但落地时大多数公司翻车。
一项针对企业 AI 落地的观察 [6]:80% 的 AI 投入看不到明显效果。失败往往不是因为技术不成熟,而是决策权没真正迁移——员工用 AI 提效了 20%,但决策流程还是工业时代的。
具体表现:
- AI 工具用得很溜,但人还是拍板的——本质上是"AI 提效",不是"AI 决策"
- 部门级 AI 试点,但跨部门决策没动——AI 工具之间无法串联,决策还是人在系统之间搬运
- 知识没沉淀,每次用 AI 都从零开始——决策系统没有"复利"
更扎心的是 OpenAI 自己的实验 [5]:他们 5 个月维护一个代码库,所有代码都是 agent 写的,但仍然需要"garbage collection"流程让 agent 持续整理。
AI 自己完成了闭环,找到了自我提升的途径。 [2] —— 没错。但前提是有人设计了那个 garbage collection 流程。
纯 AI 原生公司会走向熵增。罗马军团式公司会走向僵化。爬山机器需要有人持续推——那个推手,就是 DRI。
五、下一步:今天就做的 1 个决策权位移
纳德拉给企业列了一张表 [1]——区别是"通用"和"私有":
| 通用 | 私有 |
|---|---|
| 通用大模型(可替换) | 私有评估(看业务结果) |
| 公开刷榜 | 私有 RL(在真实数据上成长) |
| 千篇一律的知识库 | 专属知识库(让制度化记忆可检索) |
但这张表对大多数团队太抽象。更落地的版本是:
今天就找 1 个会反复做的小决策,让人退到反馈环。
比如:
- 客服回复的初稿 → 让人退到 review + 异常干预
- 测试用例的生成 → 让人退到测试策略定义
- 数据报告的生成 → 让人退到数据口径定义
- 候选人简历的初筛 → 让人退到面试环节
每一项都是一个"决策权位移"的最小实验。先做对 1 个,比规划 10 个蓝图有用。
Tom 给的检验标准 [2]:凡是被记录下来的,对 AI 而言都确有其事。把这个标准用在你那 1 个实验上——每一步决策依据都要可追溯、每个反馈都要进入循环、每个异常都要有 DRI 拍板。
12 个月后,回看这一组最小实验,你会发现"AI 原生公司"这个听起来很大的词,已经从 PPT 走进了你团队的实际运转里。
参考来源
[1] 微软 CEO 纳德拉长信,2026-06-15。
[2] YC Root Access:How to Build a Self-Improving Company with AI(Tom Blomfield 演讲),编译 2026-06-15。
[3] Anthropic 创始人行动手册:打造一家 AI-Native 创业公司,2026-05-19。
[4] Anthropic 工程负责人:工程师的变化才真正开始(Sequoia 访谈),2026-06-09。
[5] OpenAI 内部 5 个月维护 codebase 的实验。引用自 InfoQ《Coding Agent 技术全景图》。
[6] 为何企业 80% 的 AI 投入看不到效果——AI 时代企业变革的认知方法论与战略判断框架,2026-06-16。