澜码CEO周健:深化AI智能体应用,加速国资国企数智化变革

人工智能作为当今科技革命的重要驱动力,正在成为国资国企数智化变革的创新引擎。

 

10月23日,作为国内探索AI Agent落地的先行者,澜码科技创始人兼CEO周健受邀参加上海仪电集团旗下数字化赋能平台——有数了主办的《云讲堂》,以《深化AI智能体应用,加速国资国企数智化变革》为题,分享AI Agent落地国资国企的经验与思考。

 

 

以下为澜码科技创始人兼CEO周健的演讲全文,我们做了不改变原意的整理和编辑,以飨读者。

 

大模型技术的发展将带来软件开发模式的变革

 

技术的发展如同一波接一波的浪潮,且遵循着所谓的“S曲线”模式,这种模式描述了技术从缓慢增长到快速增长再到最终成熟的过程,在技术发展的初期阶段,人们往往感受不到技术的变化,直到突然进入一个快速增长期。例如人脸识别技术和自动驾驶。实际上大语言模型也进入了类似的增长周期。

 

相对来说,每种技术的发展周期取决于其技术深度和通用性,人脸识别技术在短短三到四年的时间内实现了重大突破,而自动驾驶技术则经历了超过十年的时间,仍在逐步完善。AGI的发展是一个很长的周期,但目前仍然处在一个相当早期的阶段。

 

 

OpenAI提出了5级AGI(通用人工智能)分类体系,层级由低到高分别是:

 

  • 基于大模型的信息提取和指令遵循能力,具备基本的对话和交互能力的L1;

 

  • 拥有强大推理和问题解决能力的L2,这一级别的AI能够像人类一样分析问题、制定解决方案,甚至在某些领域超越人类;

 

  • 能够独立思考、并根据复杂情境采取行动,显示出接近人类的自主决策能力的L3,在此阶段能够实现人机协同工作;

 

  • 具有创新思维和创造力的L4,协助人类进行发明创造;

 

  • 具备全面人类智能和组织能力的L5,基本可以替代人类,是AGI发展的最高级别。

 

当前,随着o1大模型的发布,AGI的发展尚处在第一个级别相对成熟,刚刚开启第二个级别的阶段,而能够自主决策的AI Agent(L3)、创新者(L4)、组织者(L5)其实是未来演进的方向。

 

大模型带来的技术变革类似于互联网和移动互联网的发展,具有颠覆性的影响,它的发展可能会改变软件开发的模式,推动全新范式的出现。

 

陆奇博士曾提到,当前开发的软件或系统大致可以分为三类,分别是:信息(感知)系统、模型(知识)系统和行动(实现)系统。

 

在过去,我们主要关注的是记录系统或者感知系统,这类系统的主要功能是将物理世界的信息数字化,通过互联网存储包括物联网设备的数据、业务流程、社交网络信息以及各类知识。

 

而现在,大模型的出现带来了知识处理和推理的能力。通过大规模数据的训练和所谓的“Scaling Law”(规模法则),大模型能够将大量数据压缩为预测能力,无论是对下一个词的预测(Next token prediction)还是对下一步行动的预测(Next action prediction),类似于一个一个相对应的“缸中大脑”。有了“缸中大脑”,我们仍然需要一个“神经中枢”,使得模型中的推理和规划能够在物理世界,或者说数字世界中实现出来。AI Agent,或者说行动系统,能够成为这样一个“神经中枢”。

 

当前大模型主要分为三大类型:纯文本模型,多模态模型和全实时、端到端模型。纯文本模型已经达到了成熟可用的地步,并且它拥有开源的、不同层级的能力;多模态也正在如火如荼地发展,但它仍然没有达到关键节点;像GPT-4o这种实时的模型则在更早期。

 

不同的模型能力可以在多个领域发挥作用。澜码在实践过程中发现,一级(L1)模型能够将专家知识数字化,将专家知识转化为文档、数据库、聊天记录或是实时语音识别的记录。这些专家知识可以用来指导AI像Copilot一样完成任务,实现自动化。

 

 

当模型达到二级(L2)水平时,AI Agent通过其推理能力,能够对任务目标进行拆解和规划,从而更好地支持业务单元的运作。在这个阶段,AI从作为业务人员的辅助工具进化为能够在专家辅导之下指导业务人员的角色。

 

而在三级(L3)阶段,无论是通过下一代的语言模型的还是AI Agent技术的发展,我们期待AI能够形成一个自我驱动的价值飞轮,帮助企业自主运转其业务。

 

GPT系列模型给一线业务人员的工作带来巨大变化。对于一线业务人员来说,他们的工作涉及大量数据文档和应用程序流程。

 

过去,由于缺乏廉价且高效的自然语言理解和表达能力,即便有RPA(机器人流程自动化)低代码BI(商业智能)工具的存在,我们也无法完全理解并处理这些数据。这些工具由于缺乏理解数据和内容思考的能力,并不被认为是智能的。

 

今天,随着大模型的发展,具备理解能力和推理能力的大模型使得智能化处理数据成为可能。例如,昨天Anthropic发布的能够使用计算机的全新大模型Claude3.5。

 

大模型的信息提取和指令遵循能力可以将专家知识和经验要素的价值释放出来,帮助人类员工跟数字世界、智能世界进行互动。并且,过去十八个月以来,开源模型的能力不断提升的同时,实现同等智能水平所需的算力成本呈指数级下降。

 

所以我们需要重新思考,如果所有的软件都具备了通用的自然语言理解和表达能力,我们应该如何设计软件功能?又该如何利用这些能力来减少员工在重复性劳动上所花费的时间?

 

专家知识的数字化是构建全新软件系统的关键

 

我们认为,专家知识是解决问题的关键。

 

我们把项目落地过程中涉及到的知识分为两个部分,显性知识和隐性知识。一方面,显性知识指的是专家能够总结成自然语言的部分知识,例如标准操作流程、业务规则、事实性知识等。整理好显性知识实际上已经能够大大提高模型应用的准确率,同时,在专家的辅助之下,对基本模型的算力要求会大大降低。另一方面,冰山之下有很多隐性知识,包括专家经验、认知结构模型等,这需要大模型有更多的推理能力才能达到。

 

 

例如,在我们服务的国家电网某省公司物资分公司采购付款稽核的项目中,采购付款稽核存在着审核量大、相应风险高的情况,如何通过AI Agent更高效、高质地实现准确的付款稽核?

 

我们结合专家知识、大量的基础数据以及机器学习模型来辅助专家发现各种风险,这样一来,专家只需审查最终的推理过程即可做出决策,这种方法大大加快了单个任务的处理速度,并且充分利用了以往数字化建设中的资产。

 

另外,在该客户的供应商评审场景中,电网公司拥有一个整理了大量供应商资质信息的电子商务平台,平台对不同类型的供应商设定了具体要求,涵盖财务状况、资质认证、员工信息以及历史合同情况等内容。供应商需自行在平台上提交资料,我们的Agent依据数据资料梳理出专家评审规则,并依据规则自动处理供应商提交的所有材料,确保每一条细则都被仔细检查,这样,专家只需审查已将规范和相应证据关联起来的综合信息就能完成评审工作。

 

在过去,一名专家可能需要半天时间来处理一个任务,而现在,在只投入两块CPU的算力情况下,一天能够处理40个任务,效率提升了十倍以上。更重要的是,随着算力的增加,处理速度还将持续提高。

 

此外,AI能够记录下重复性的劳动,判断的依据全部被数字化,专家或者审核员只需最后确认依据即可完成决策,这个过程让评审变得更加透明,专家知识也可以被用来给大模型进行进一步的训练微调。

 

第三个案例是某保险公司的健康产品推荐助手项目,根据体检报告推荐相应的健康保险产品,生成个性化营销话术。虽然保险代理的数量庞大,但保险代理本身的专业知识水平有限,很难准确做到根据体检报告指标进行个性化营销。

 

我们将专家知识整理成表格,通过大模型的自然语言理解、表达能力以及指令遵循能力,从体检报告中抽取关键指标信息,根据规则匹配保险产品,最后进行相应的产品推荐和话术生成。保险代理根据Agent提供的结果进行客户转换,保险产品推荐的转化率提高了三倍以上。

 

以上是目前大模型通用、便宜的自然语言理解和表达能力的一些实际落地应用。未来,我们还能够进行一些新的尝试。

 

AI Agent未来趋势:构建以角色为中心的价值飞轮

 

AI Agent作为企业内的数字员工,与传统员工的区别是,雇佣和培训员工需要花费大量时间成本,而当企业拥有Agent这样的数字员工,只需要通过增加算力就能够增加Agent业务能力的带宽,并且可以根据不同业务需求设计不同的Agent来实现业务应用。这是数字化技术带来的全新可能,企业内部业务流程、组织结构以及已有的数字化系统可能都会随之改变。

 

澜码认为,企业内部最重要的要素是决策的制定,从组织结构上,可以从横向和纵向两个维度来看待企业运作:

 

  • 横向协作:不同的部门和职能通过相应的上下游协作来完成一个业务目标。

 

  • 纵向管理:涵盖不同管理层级,其职责包括制定计划、实施管控以及监督执行过程,并提供必要的指导和支持。

 

 

企业现有数字化业务架构分为三个部分:最底层的信息流、中间层的控制流和最上层的业务流:

 

  • 信息流:包括企业内部使用的各种数字化系统所生产的数据信息,如微信、Excel、Tiktok等;

 

  • 控制流:为业务人员提供任务执行流程中的规则或参考,这其中涉及到企业内的产品手册、客户案例、数据、作业规范等;

 

  • 业务流:关注于企业内部不同人员及角色间的协作方式。

 

随着技术的发展,我们期待能够增强控制流的自动化。当前的AI Agent或者说Agentic AI,这类新技术的应用实际上是以目标为导向的。与过去以功能为中心的传统软件不同,未来的趋势应当是以角色为中心的设计,例如销售总监、物流总监、零售门店的大区经理,针对这些不同的角色和不同的目标设计AI Agent,更好地支持不同角色的需求。

 

在当前的业务环境中,基层业务单元负责将总体目标细分为具体的任务,并通过员工的执行将结果录入不同的系统中。在AI 1.0时代,我们已经能够通过Copilot的方式将任务自动化。而在2.0时代,我们的目标是进一步将目标拆解与任务自动化相结合,围绕角色和目标驱动,形成一个新的数据飞轮。

 

 

目前,在不同的流程中有很多系统的断点,如CRM、OA、ERP等,这些断点依靠人来衔接。在大模型1.0时代,我们已经将许多文档数字化,可利用的知识量大大增加。然而,我们仍然面临着如何更好地拆解目标、基于历史数据和情景记忆进行反思和改进的挑战,这是我们下一步需要做的事情。

 

在某个股份制银行对公业务产品智能推荐的项目中,Agent会根据用户输入内容识别需求,并将任务的规划和实现过程可视化,当业务人员在执行过程中提出新的要求时,Agent也会重新计算结果。

 

在这个例子中,我们将相关需求的推理过程可视化展现出来,将其变成可解释、可迭代的,使得业务人员在交互过程中能更直接理解智能体的思考逻辑,并能及时调整个性化的需求,提升业务处理质量和效率。

 

我们将技术应用从以功能为核心转向为以目标为导向,将推理过程变成可解释、可迭代,由此构建可信任的AI Agent,从而使知识和数据的飞轮转起来。

 

 

而构建以角色为中心的价值飞轮,我们认为有以下几个步骤:

 

  • 传统状态(初始阶段):业务人员自行将目标拆解为具体任务,并通过操作GUI来完成工作任务。

 

  • 专家知识数字化阶段:专家将专业知识和经验数字化,形成Copilot,协助业务人员完成任务。

 

  • 目标拆解自动化阶段:通过专家构建目标拆解的Copilot,自动将任务派发给业务人员,业务人员在任务自动化过程中能够使用AI Agent 自动完成任务。

 

  • 反思与优化阶段:专家根据运行数据进行反思,进一步提高Agent水平

 

经过这样的步骤,形成一个由专家、管理者以及一线业务人员共同参与的价值循环,从而不断提高业务完成质量,放大业务竞争优势。

 

总结以上内容,我认为AI Agent有两个成功的关键:

 

首先是业务知识的梳理,需要清晰地整理和理解业务流程中的核心知识,包括业务流、控制流和信息流,要明确目标空间、状态空间以及可行的行动空间,定义用于评估中间状态的价值函数。

 

其次是专家知识的数字化,AI靠数据驱动,将私域数据和私域认知架构数字化,从而启动价值飞轮,形成企业壁垒。

 

未来的模型架构仅仅包含现有的大语言模型是不够的,可能需要加上GPT-o1这样的大模型,同时,这个模型架构不是完全敲定的,更多是提供模型架构训练的方法,以此能够启发我们构建模型训练的飞轮以及工程的框架,最终在业务场景中放大AI Agent的价值。