摘要
本文探讨了AI代理时代,企业软件系统的演变。传统系统如Salesforce和Workday是记录系统,而AI代理需要决策痕迹作为基础。本文提出“上下文图谱”概念:通过记录决策过程的例外、 precedent 和跨系统上下文,形成可查询的决策记录。这将成为下一个万亿美元平台,帮助企业实现自动化决策。针对初创企业,提供构建路径和投资信号,强调代理系统在执行路径中的优势。
引言:AI代理时代的系统记录之辩
在企业软件的历史中,上一代系统通过掌控核心数据和流程,构建了一个万亿美元的生态系统。Salesforce管理客户数据,Workday处理员工事务,SAP主导运营流程。这些系统成为“记录系统”(systems of record),拥有规范数据、主导工作流,并实现用户锁定。
如今,随着AI代理的兴起,一个核心辩论浮出水面:这些传统系统能否在代理时代存活?Jamin Ball的近期文章《Long Live Systems of Record》引发了广泛讨论。他反驳了“代理杀死一切”的叙事,认为代理不会取代记录系统,而是提升了对优秀记录系统的标准。
我们赞同这一观点。AI代理是跨系统的、行动导向的。工作的用户体验(UX)正与底层数据平面分离。代理将成为界面,但底层仍需一个规范的系统作为支撑。
然而,我们的观点更进一步:Ball的框架假设代理所需的数据已存在于某处,代理只需更好的访问权限、治理机制、语义契约,以及明确规则来决定哪个定义适用于特定目的。这只是图景的一半。另一半是企业实际运行的缺失层:决策痕迹(decision traces)——包括例外、覆盖、先例和跨系统上下文,这些目前散布在Slack线程、交易桌对话、升级通话以及员工头脑中。
决策痕迹 vs. 规则:代理需要的不仅仅是规则
关键区别在于:规则告诉代理一般情况下该做什么(例如,“报告中使用官方ARR定义”),而决策痕迹捕捉特定案例中实际发生了什么(例如,“我们使用了X定义,在政策v3.2下,VP批准了例外,基于先例Z,并记录了变更”)。
代理不仅仅需要规则,还需要访问过去规则应用的决策痕迹:规则如何被应用、例外在哪里被授予、冲突如何解决、谁批准了什么、先例如何主导现实。这些痕迹构成了企业决策的“隐形知识”,目前未被系统化捕捉。
在这里,代理系统初创企业具有结构性优势。它们位于执行路径中。在决策时刻,它们看到完整上下文:从多个系统收集的输入、评估的政策、调用的例外路径、批准者和写入的状态。如果持久化这些痕迹,企业将获得目前大多不存在的东西:可查询的决策制作记录。
我们将这些痕迹积累形成的结构称为“上下文图谱”(context graph):不是模型的“思维链”(chain-of-thought),而是一个活的决策痕迹记录,跨实体和时间缝合,使先例变得可搜索。随着时间推移,这个上下文图谱将成为自治(autonomy)的真实真相来源——因为它解释了不仅仅是发生了什么,而是为什么被允许发生。
核心问题不再是现有记录系统是否存活,而是全新记录系统是否会涌现——针对决策而非仅对象的记录系统——以及这些是否将成为下一个万亿美元平台。
记录系统捕捉不到的内容:代理在真实工作流中的壁垒
AI代理正被部署到真实工作流中,如合同审查、报价到现金(quote-to-cash)、支持解决(support resolution)。团队们正撞上治理机制无法解决的墙。
这个墙不是数据缺失,而是决策痕迹缺失。代理遇到了人类每天用判断和组织记忆解决的歧义。但这些判断的输入从未作为持久化工件存储。具体来说:
头脑中的例外逻辑:例如,“我们总是给医疗保健公司额外10%的折扣,因为他们的采购周期很残酷。”这不在CRM中,而是通过入职和闲聊传递的部落知识。
过去决策的先例:例如,“上季度我们为公司X构建了类似交易——我们应该保持一致。”没有系统链接这两个交易或记录结构选择的理由。
跨系统综合:支持负责人检查Salesforce中的客户ARR,看到Zendesk中的两个开放升级,阅读Slack线程标记的流失风险,然后决定升级。这种综合发生在头脑中。票据只说“升级到Tier 3”。
系统外的批准链:VP在Zoom通话或Slack DM中批准折扣。机会记录显示最终价格,但不显示谁批准了偏差或为什么。
这就是“从未捕捉”的含义。不是数据脏乱或孤岛,而是连接数据到行动的推理从未被视为数据。
上下文图谱:持久化决策层
当初创企业通过代理编排层记录每个运行的决策痕迹时,它们获得了企业几乎从未拥有的东西:结构化、可重放的上下文转行动历史。
在实践中,这是什么样子?一个续订代理提议20%折扣。政策将续订上限设为10%,除非批准服务影响例外。代理从PagerDuty拉取三个SEV-1事件,从Zendesk拉取开放的“取消除非修复”升级,以及上季度VP批准类似例外的续订线程。它将例外路由到财务。财务批准。CRM最终只有一个事实:“20%折扣”。
一旦拥有决策记录,“为什么”成为一流数据。随着时间,这些记录自然形成上下文图谱:企业已关心的实体(账户、续订、票据、事件、政策、批准者、代理运行)通过决策事件(关键时刻)和“为什么”链接连接。公司现在可以审计和调试自治,将例外转为先例,而不是每季度在Slack中重新学习相同边缘案例。
反馈循环使这 compounding。捕捉的决策痕迹成为可搜索先例。每个自动化决策添加另一个痕迹到图谱。
这不需要从第一天实现完全自治。它从人机协作开始:代理提议、收集上下文、路由批准,并记录痕迹。随着类似案例重复,更多路径可以自动化,因为系统拥有结构化的先前决策和例外库。即使人类仍做决定,图谱也会增长,因为工作流层捕捉输入、批准和理由作为持久先例,而不是让它在Slack中消亡。
为什么现有巨头难以构建上下文图谱
Ball乐观地认为现有玩家会演变为这种架构。数据仓库成为“真相注册表”,CRM成为“带API的状态机”。他的叙事是演化而非取代。
这可能适用于使现有数据更易访问。但它不适用于捕捉决策痕迹。
运营巨头是孤岛化的,优先考虑当前状态。Salesforce推动Agentforce,ServiceNow有Now Assist,Workday为HR构建代理。他们的卖点是“我们有数据,现在添加智能”。
但这些代理继承了父系统的架构限制。Salesforce建立在当前状态存储上:它知道机会现在看起来如何,而不是决策时如何。当折扣被批准时,正当其的上下文未被保存。你无法重放决策时刻的世界状态,这意味着无法审计决策、从中学习或用作先例。
它们还继承了盲点。一个支持升级不只在Zendesk中。它取决于CRM的客户层级、计费的SLA条款、PagerDuty的近期中断,以及Slack标记流失风险的线程。没有巨头看到这些,因为没有巨头位于跨系统路径中。
数据仓库玩家有不同问题:它们在读路径中,而非写路径。
Ball将Snowflake和Databricks定位为“真相注册表”层。两者都在倾斜——Snowflake推动Cortex并收购Streamlit,Databricks收购Neon并推出Lakebase和AgentBricks。卖点:数据平台取代记录系统,成为AI代理的基础。
仓库确实有时间视图。你可以查询历史快照、跟踪指标变化,并在时期间比较状态。但仓库通过ETL在决策后接收数据。到数据落地Snowflake时,决策上下文已消失。
一个只看到事后读的系统,无法成为决策血统的记录系统。它能告诉你发生了什么,但无法告诉你为什么。
Databricks在拼凑这些部分上更先进。但接近代理构建处 ≠ 位于决策发生的执行路径中。
代理系统初创企业的结构性优势:它们在编排路径中。当代理分类升级、响应事件或决定折扣时,它从多个系统拉取上下文、评估规则、解决冲突并行动。编排层看到全貌:收集的输入、应用的规则、授予的例外和为什么。因为它执行工作流,它可以在决策时刻捕捉上下文——不是事后通过ETL,而是当下,作为一流记录。
这就是上下文图谱,它将成为AI时代公司最有价值的资产。
现有巨头会反击。他们会尝试收购来附加编排能力。他们会锁定API并采用出口费使数据提取昂贵—— hyperscalers使用的相同剧本。他们会构建自己的代理框架并推动“一切留在我们生态中”的叙事。
但捕捉决策痕迹需要位于提交时刻的执行路径中,而不是事后附加治理。巨头可以使提取更难,但无法插入它们从未参与的编排层。
初创企业的三条路径
代理系统初创企业将采取不同路径,每条都有权衡。
路径一:从第一天取代现有记录系统。 一个围绕代理执行重建的CRM或ERP,带有事件源状态和原生政策捕捉的架构。这很艰难,因为巨头根深蒂固,但可在转型时刻 viable。
在众多瞄准AI SDR类别的初创中,Regie选择构建AI原生销售参与平台,取代像Outreach/Salesloft这样的遗留平台,这些是为人类在碎片化工具链中执行序列设计的。Regie设计用于混合团队,其中代理是第一类行动者:它可以 prospect、生成外展、运行跟进、处理路由,并升级到人类。
路径二:取代模块而非整个系统。 这些初创针对例外和批准集中的特定子工作流,然后成为那些决策的记录系统,同时将最终状态同步回巨头。
Maximor在财务中这样做:自动化现金、关闭管理和核心会计工作流,而不撕掉总账。ERP仍是账本,但Maximor成为调和逻辑存在的真相来源。
路径三:创建全新记录系统。 这些初创从编排层开始,但它们持久化企业从未系统存储的东西:决策痕迹。随着时间,这个可重放血统成为权威工件。代理层停止是“只是自动化”,成为业务去回答“为什么我们这么做?”的地方。
PlayerZero体现了这种模式。生产工程位于SRE、支持、QA和dev的交汇处:一个经典的“胶水函数”,其中人类携带软件未捕捉的上下文。PlayerZero从自动化L2/L3支持开始,但真正资产是它构建的上下文图谱:代码、配置、基础设施和客户行为在现实中如何交互的活模型。这个图谱成为“为什么这坏了?”和“这个变更会坏生产吗?”的真相来源:现有系统无法回答的问题。
随着初创追求这些路径,代理的可观察性将成为关键基础设施。随着决策痕迹积累和上下文图谱增长,企业将需要监控、调试和评估代理行为规模化。
Arize正在构建这个新栈的可观察性层——给团队可见性,看代理如何推理、哪里失败,以及决策随时间如何表现。正如Datadog成为监控应用的必需基础设施,Arize定位成为监控和改进代理决策质量的必需基础设施。
p0.163sohu.mobi453
rb.163sohu.mobi342
5Z.163sohu.mobi532
3X.163sohu.mobi343
1V.163sohu.mobi643
Tx.163sohu.mobi2346
Rv.163sohu.mobi623
Pt.163sohu.mobi975
Nr.163sohu.mobi342
Lp.163sohu.mobi834
创始人关键信号
构建机会的信号重叠,但不相同。
适用于所有三条机会的两个信号:
高头数。如果公司有50人手动做工作流(路由票据、分类请求或系统间调和数据),这是信号。劳动力存在因为决策逻辑太复杂,无法用传统工具自动化。
例外密集决策。例行、确定性工作流不需要决策血统:代理只是执行。有趣表面是逻辑复杂、先例重要、“取决于”的诚实答案的地方。想想交易桌、承销、合规审查和升级管理用例。
一个指向全新记录系统机会的特定信号:
位于系统交汇处的组织。RevOps存在因为有人必须调和销售、财务、营销和客户成功。DevOps存在因为有人必须桥接开发、IT和支持。Security Ops位于IT、工程和合规之间。
这些“胶水”函数是线索。它们涌现正是因为没有单一记录系统拥有跨功能工作流。组织图创建角色来携带软件未捕捉的上下文。
一个自动化该角色的代理不仅仅更快运行步骤。它可以持久化该角色创建的决策、例外和先例。那是通往新记录系统的路径:不是撕掉巨头,而是通过代理位于工作流中捕捉只在代理位于工作流时才可见的真相类别。
重新想象记录系统:下一个万亿美元平台的基石
问题不是记录系统是否存活——它们会。问题是下一个万亿美元平台是通过向现有数据添加AI,还是通过捕捉使数据可行动的决策痕迹构建。
我们认为后者。而且今天构建上下文图谱的初创正在奠定基础。
共同学习,写下你的评论
评论加载中...
作者其他优质文章