AI 原生的企业组织形式畅想

六月 17, 2026

一家公司最贵的不是工资，是决策。
接下来 12 个月，最值得观察的也不是哪家模型又刷了榜——而是哪家公司的决策权，悄悄从人手里交到了系统里。

一、错的问题：“AI 提效 20%”

一年前大家聊"AI 时代公司怎么变"，答案通常是：让工程师多写 20% 代码，让销售多打 20% 电话，让运营多处理 20% 工单。

YC 的 Tom Blomfield 给这个思路判了死刑 [2]：

这就好比给一种老旧的工作方式装上更强劲的引擎。真正值得深思的，并不是如何给旧组织中添加一个 AI 工具，而是重新构想公司本身究竟是什么，以及它应当如何运作。

他举了一个细节 [2]：他坚信团队里那个叫 Garry 的工程师，现在一个人写出的代码比整个工程团队还多。如果这是真的——当 1 个工程师的产出 ≈ 整个团队，所谓的"提效"就不再是"省人"，而是"换形态"。

提效的天花板不是"省 20% 时间"，是"公司是什么"被重新打开。

这个被打开的入口，是决策权。

二、AI 原生公司的定义：决策的主体变了

AI 原生公司不是"一家用 AI 的公司"。它的特征是决策的主体从人迁移到系统。

传统公司，决策在层级里发生：CEO 拍板 → VP 解读 → Manager 分配 → IC 执行。每一步都需要人当传话筒，每一步都会失真。

AI 原生公司里，决策在循环里发生：

传感器层 → 策略/决策层 → 工具层 → 质量关卡 → 学习机制
（邮件/工单/遥测）  （规则）  （确定性API）  （高风险检查）  （反馈回起点）

这 5 层是 Tom 提的（[2]）。但我读完 30 多篇材料后，真正想强调的不是"5 层"这个具体架构，而是它背后那件事：

决策可以脱离人独立运行。人在循环里，但不再是"传话筒"，而是"反馈环"和"异常干预者"。

Anthropic 内部那个"自动改 PR"的 Agent 不是炫技 [2][3]：

监控系统看哪个查询失败
判断是不是缺工具
写代码、提 PR
另一个 Agent 审查、合并、部署
第二天查询就能用

这中间没有人做决策。系统在做。人在做的只是：当系统卡住时拍板。

纳德拉把这个新形态叫"爬山机器" [1]：

这个循环将成为公司新的知识产权。它具有复利效应：每一次工作流的改进都会产生更好的训练信号，加速公司独有的隐性知识积累。

罗马军团用纪律维持秩序。爬山机器用复利积累知识。两种逻辑、两种公司——但根本区别不在技术，在决策权在谁手里。

三、决策权迁移会带出 3 个相互关联的位移

决策权一动，剩下的一切都被拖动。这是我自己的判断，不是某个 CEO 说的，但每条都有人在做、有人踩过坑。

位移 1：决策权位移 —— 从人到系统

不抽象，看一个具体例子。

传统客服：

用户发工单
客服读工单 → 判断问题类型 → 查知识库 → 写回复
主管 review 回复质量

AI 原生客服：

用户发工单
Agent 读工单 → 查知识库 → 调用 LLM 生成回复
质量关卡（确定性检查 + 风险过滤器 + 高风险人工 review）
客户回复"不解决问题"→ Agent 自动升级到人工
“不解决问题"的工单 → 自动汇总到产品 backlog
相似工单出现第 3 次 → Agent 自动写 FAQ

关键差别：每一步决策的主体不同。前者人，后者系统。人没有消失，但人退到了"反馈环"和"异常干预"的位置。

这就是"5 层架构"在客服场景里的具体化——但它不是 5 步流程，是一个自我修正的循环。

位移 2：角色位移 —— 从"决策者"到"反馈环”

既然决策权移了，角色的本质就变了。

Anthropic 的工程负责人说 [4]：

中层管理时代结束了。

这话听着像管理学口号，但配合 Tom 的两个角色定义 [2] 就清楚了：

未来公司只靠两个角色运转：IC（独立贡献者）+ DRI（直接责任人）。

DRI 不是传统意义的"决策者"。DRI 是反馈环的接口人——当系统卡住时拍板、当系统出错时纠偏、当系统的判断标准过时了重新定义标准。

DRI 不是少做事了，是做的事完全变了：从"做决策"变成"训练决策系统"。

我自己的判断：DRI 的能力门槛反而提高了。只有资深 IC 才有资格做 DRI——因为他要判断系统"卡得对不对"，这件事本身就需要业务深度。

位移 3：经济学位移 —— 从"人头 × 时薪"到"Token × 知识密度"

YC 的统计 [2]：Demo Day 公司的"人均营收"在过去 18 个月涨了约 5 倍。Tom 预言这个趋势会蔓延。

传统公司经济学：

收入 ≈ 人数 × 人均产出
成本 ≈ 人数 × 时薪
利润 = 收入 - 成本（人数是核心变量）

AI 原生公司经济学：

收入 ≈ 决策循环数 × 每次循环的价值
成本 ≈ Token 消耗 + 知识沉淀成本
利润取决于Token 利用密度和知识复利速度

真正的制约因素将不再是员工人数，而是 Token 的使用量、业务上下文质量、组织知识的可读性。 [2]

这条位移对所有公司都是地震级——员工数不再是"成功指标"，反而可能是"复杂度税"。

凡是被记录下来的，对 AI 而言都确有其事；凡是没有被记录的，对你的 AI 而言就根本没发生过。 [2]

知识密度才是新护城河。

四、清醒的一面：80% 的 AI 转型为什么失败

三个位移在理论上顺，但落地时大多数公司翻车。

一项针对企业 AI 落地的观察 [6]：80% 的 AI 投入看不到明显效果。失败往往不是因为技术不成熟，而是决策权没真正迁移——员工用 AI 提效了 20%，但决策流程还是工业时代的。

具体表现：

AI 工具用得很溜，但人还是拍板的——本质上是"AI 提效"，不是"AI 决策"
部门级 AI 试点，但跨部门决策没动——AI 工具之间无法串联，决策还是人在系统之间搬运
知识没沉淀，每次用 AI 都从零开始——决策系统没有"复利"

更扎心的是 OpenAI 自己的实验 [5]：他们 5 个月维护一个代码库，所有代码都是 agent 写的，但仍然需要"garbage collection"流程让 agent 持续整理。

AI 自己完成了闭环，找到了自我提升的途径。 [2] —— 没错。但前提是有人设计了那个 garbage collection 流程。

纯 AI 原生公司会走向熵增。罗马军团式公司会走向僵化。爬山机器需要有人持续推——那个推手，就是 DRI。

五、下一步：今天就做的 1 个决策权位移

纳德拉给企业列了一张表 [1]——区别是"通用"和"私有"：

通用	私有
通用大模型（可替换）	私有评估（看业务结果）
公开刷榜	私有 RL（在真实数据上成长）
千篇一律的知识库	专属知识库（让制度化记忆可检索）

但这张表对大多数团队太抽象。更落地的版本是：

今天就找 1 个会反复做的小决策，让人退到反馈环。

比如：

客服回复的初稿 → 让人退到 review + 异常干预
测试用例的生成 → 让人退到测试策略定义
数据报告的生成 → 让人退到数据口径定义
候选人简历的初筛 → 让人退到面试环节

每一项都是一个"决策权位移"的最小实验。先做对 1 个，比规划 10 个蓝图有用。

Tom 给的检验标准 [2]：凡是被记录下来的，对 AI 而言都确有其事。把这个标准用在你那 1 个实验上——每一步决策依据都要可追溯、每个反馈都要进入循环、每个异常都要有 DRI 拍板。

12 个月后，回看这一组最小实验，你会发现"AI 原生公司"这个听起来很大的词，已经从 PPT 走进了你团队的实际运转里。

参考来源

[1] 微软 CEO 纳德拉长信，2026-06-15。

[2] YC Root Access：How to Build a Self-Improving Company with AI（Tom Blomfield 演讲），编译 2026-06-15。

[3] Anthropic 创始人行动手册：打造一家 AI-Native 创业公司，2026-05-19。

[4] Anthropic 工程负责人：工程师的变化才真正开始（Sequoia 访谈），2026-06-09。

[5] OpenAI 内部 5 个月维护 codebase 的实验。引用自 InfoQ《Coding Agent 技术全景图》。

[6] 为何企业 80% 的 AI 投入看不到效果——AI 时代企业变革的认知方法论与战略判断框架，2026-06-16。