多智能体规模化:一场从「能跑」到「能用」的跨越
去年年底,一位名叫 Will 的独立开发者在网上分享了一组数字:他在 54 个波次中并行调度 AI 智能体,累计完成 321 个文件的工作量,覆盖代码、文档、音频等多个领域,核心工作压缩在 30 分钟内完成。
这个数字足够震撼。但更值得注意的,是他设计这套系统时遵循的一个原则:将智能体分为两种角色——一种像「神」,负责跨波次保持上下文,统领全局;另一种像「英雄」,执行单次任务后即销毁,不保留状态。
这个设计后来有了一个名字:Pantheon。
从一个代理到多个代理:范式正在形成
多智能体系统并不是新概念。2016 年,随着大语言模型能力的提升,业界就开始讨论「多个 AI 协作完成复杂任务」的可能性。但很长一段时间内,这个想法停留在论文和实验里。真正让范式清晰落地的,是 Pantheon 系统展示的架构思路:持久代理(Gods)加上临时代理(Heroes)。
「神」负责维护全局上下文——它知道之前做了什么、接下来要做什么,不需要每次都从头开始。「英雄」则专注于手头的具体任务,做完就走,不积累状态,不产生干扰。
这个组合解决了一个核心矛盾:长程上下文成本高昂,但任务的阶段性产出又需要被记住和衔接。Pantheon 的数据给出了最直接的证明——原本需要数天的跨领域工作,被压缩到了 30 分钟。
有趣的是,这一设计方向与另一个项目的发现形成了互证。Unblocked 的 CEO Dennis Pilarinos 在一次访谈中指出,多智能体落地的最大障碍既不是模型能力,也不是算力,而是上下文断层——代码、PR、文档、聊天记录、生产遥测数据各自割裂,智能体在不同数据源之间跳跃时丢失了「我是谁、我在做什么」的理解。Unblocked 的解法与 Pantheon 如出一辙:构建一个上下文引擎,将多源数据统一聚合后再供给 AI 代理。
换句话说,两条独立的技术路径,在「上下文管理」这个节点上汇合了。这不是巧合。它说明多智能体规模化面临的核心挑战正在被行业识别和收敛。
技术跑通了,然后呢?
但技术可行,不代表组织就绪。
Factory CEO Matan Grinberg 不久前接受麦肯锡访谈时说了一句值得玩味的话:企业 AI 规模化的瓶颈,已经从「能不能做」转移到了「怎么做才对」。 他的观察是,许多企业把 AI 落地当做一个技术项目,买工具、接 API、跑 POC——然后发现生产环境中 AI 的表现和 demo 里完全不一样。
原因并不复杂。技术原型可以在受控环境下跑通,但生产环境中的团队有新人入职、有跨部门协作、有知识在个人脑子里而非文档里的情况。这些是组织问题,不是模型问题。
Grinberg 的判断是,企业需要重新设计团队的工作方式,而不是简单地把 AI 嵌入现有流程。他将这个阶段称为 AI 规模化的「第二曲线」:第一曲线是技术可行性验证,第二曲线是组织就绪度建设。
这与 Dennis Pilarinos 在工程层面的判断高度吻合。上下文工程在技术上解决的是数据聚合问题,在组织上解决的却是知识传承问题——一个新人如何快速理解项目上下文?一个跨团队协作如何不让 AI 产生信息孤岛?
这里出现了两种截然不同的视角。Pantheon 属于个人极致效率实验:一人加一套自动化系统,追求的是「我一个人能做完多少事」。而 Grinberg 描述的是企业级变革:重新审视组织架构、流程设计和权限管理,追求的是「一个团队如何与 AI 协同工作」。两者都认可多智能体架构的价值,但在「谁来适应 AI」这个问题上,立场不同——前者是 AI 去适应人,后者是组织去适配 AI。
数据层:被忽视的基础设施
如果说上下文是多智能体的「内存」,那么数据层就是「硬盘」。
MongoDB 工程副总裁 Fred Roma 在一次系统架构讨论中提到,从原型到生产环境,最大的瓶颈不在模型,而在数据层。这个判断基于一个朴素的事实:模型的推理能力再强,如果数据检索不准,上下文就不准确,输出就不可靠。
MongoDB 收购 Voyage AI 补强 embedding 和 rerank 能力,正是这一判断的市场印证。向量搜索、语义检索、上下文增强——这些原本属于搜索领域的底层技术,正在成为 AI 应用栈的新基础设施。
这个趋势的逻辑很清晰:多智能体系统的一个核心能力,是根据上下文状态决定下一步行动。如果数据检索的延迟高、相关性差,智能体的决策质量就会直接下降。换句话说,数据层的性能直接决定了智能体系统的响应质量。
这不是某一个项目的观察。上下文引擎、多源数据聚合、向量数据库——这些词汇在不同的访谈和文章中反复出现,频率越来越高。它们共同指向一个结论:数据层正在从「存储」角色升级为「智能」角色,这是多智能体规模化不可跳过的工程问题。
个人实验与企业变革之间
回到文章开头 Will 的那组数字。321 个文件、54 波次、30 分钟——这是一个令人印象深刻的个人效率实验。但必须承认,它的成功依赖于一个前提:只有一个人在用这套系统。没有权限层级、没有协作冲突、没有需要审批的变更。
这正是个人实验和企业场景的本质差异。个人实验可以追求极致的自动化,企业变革则需要在控制与效率之间找到平衡。Grinberg 在访谈中描述的企业 AI 规模化路径,远比 Pantheon 的技术架构更复杂:它涉及谁有权调用哪个智能体、产出结果的归属和责任、变更的审批流程、跨团队的上下文共享……
技术上的自动化可行,与组织上的变革就绪,中间隔着流程、权限和知识管理三大障碍。 这不是唱衰多智能体系统,而是说明——真正限制 AI 规模化的,从来不是代码写不出来,而是组织接不住。
写在最后
多智能体系统正在经历一个典型的技术成熟曲线:早期由个人开发者和极限实践者探索边界,中期行业在工程层面收敛到几个核心问题(上下文管理、数据层、协作协议),后期这些问题才会逐步进入企业流程改造的视野。
Pantheon 的「Gods + Heroes」架构、上下文引擎的聚合能力、向量检索基础设施的升级——这些技术路径目前仍处于早期,但它们指向的方向是明确的:未来的 AI 系统不会是单一大模型,而是一组各司其职的智能体,在持久上下文的统领下协作完成复杂任务。
有意思的是,同一赛道上,创始人的背景也在分化。有的人选择被大厂收购、在成熟体系内迭代产品;有的人选择独立融资、面向企业客户构建信任。两条路径没有对错,但它们决定了产品的节奏和讲故事的方式。
行业还在早期。真正的问题不是「多智能体能做什么」,而是「谁准备好了让多智能体真正跑起来」。
综合来源:Dev.to 多智能体并行调度实践、Unblocked CEO 上下文工程访谈、Fred Roma 生产级 AI 系统架构讨论、Factory CEO Matan Grinberg 麦肯锡访谈。