一文读懂AI Agent的运行流程

全球知名风险投资机构红杉资本最近发布的AI行业年度报告《Generative AI's Act o1》中指出,OpenAI 的o1大模型的发布将生成式人工智能推向了新方向:从“快速思考”,转向“慢速思考”。

 

也就是,由即时的预训练响应,转向了推理阶段进行思考,而这种演变将带来一批新的智能Agent应用,更多风险投资和机构开始意识到,能够自主决策的AI Agent是AGI未来演进的方向。

 

AI Agent作为企业内的“数字员工”,可以根据不同业务需求设计不同的Agent来实现业务应用,并且只需要通过增加算力就能够增加Agent业务能力的带宽。随着AI Agent的发展,企业内部业务流程会随之发生变化,未来的企业结构将更多依赖AI Agent。

 

而AI Agent的应用落地涉及到从战略对齐到落地实施的一系列复杂流程,深奥晦涩的技术理论和细节往往会给企业用户在实际落地Agent过程中带来困扰。澜码认为,全面了解AI Agent的运行流程是企业用户应用Agent的首要步骤,同时也是放大Agent业务价值的基础。

 

《2024爱分析·中国AI Agent市场研究报告》(以下简称“《报告》”)中对AI Agent在企业中运行流程的阐述,与澜码过去的探索和实践高度一致。因此我们将《报告》中的相关内容做了不改变原意的摘录,与大家分享👇🏻

 

AI Agent的市场定义

 

AI Agent是能够感知环境,基于目标进行决策并执行动作的智能化应用。不同于传统人工智能应用(主要指规则引擎、机器学习、深度学习等技术为核心)和RPA机器人,AI Agent能够基于目标和对现状能力的认知,在环境约束中,依赖特定资源和现有工具,找到行动规则并将行动拆解为必要的步骤,自主执行步骤,达成目标。

 

AI Agent的核心组件

 

AI Agent的核心组件是四大类:记忆、规划、工具和执行。

 

 

工具分成执行类工具、算法类工具和信息类工具;

 

记忆包含短期记忆和长期记忆,短期记忆反应的是Agent的当前情况,即在执行任务和与环境交互时产生的信息和数据,它存储了Agnet最近的感知输⼊、⽬标以及中间内部推理的结果;长期记忆包括语义记忆、程序记忆和情景记忆。其中,语义记忆是可用自然语言描述的记忆;程序记忆是企业内部的业务流程与SOP;情景记忆是过去业务情景的复现。

 

规划包含工作流、思维链、提示词工程等,主要是通过这些方式,充分激发大模型的能力,实现针对任务目标的问题拆解和任务规划。

 

AI Agent在企业用户落地价值

 

(1)AI Agent是由模型、数据、算力、专家知识组成的新质生产力:

 

新质生产力是以全要素生产率大幅提升为标志,本质是先进生产力,代表生产力迭代升级的方向。

 

从现代生产力变革看,科学技术越来越成为生产力最主要推动力量,科技创新是发展新质生产力的核心要素。大模型作为当前科技创新的重要组成部分,以大模型为代表的新“智”技术是新质生产力的重要生产工具。

 

Al Agent 作为大模型技术的重要应用,具备推理规划、记忆存储、知识沉淀、执行工作等能力,是智能化时代的新型劳动者,是新质生产力的代表。AI Agent生产过程需要算力、数据、模型、专家知识等核心要素的支撑。

 

(2)AI Agent是激发数据要素价值的重要手段:

 

Al Agent作为智能化应用,是激发数据要素的重要手段。一方面是丰富数据应用场景,数据应用不再仅仅是数据报表、数据看板、自助分析等基础数据分析工具,还涌现出智能运维、营销助手、数字员工等诸多数据应用场景;另一方面,AI Agent大幅提升数据应用价值,特别是沉淀专家知识等非结构化数据,有助于企业内部数据资产化,提升数据要素流通效率。

 

Al Agent 对数据基础设施提出新需求。除了要满足国家数据要素建设标准(四大设施(网络设施、算力设施、流通设施、安全设施)和六大能力(数据汇聚、数据处理、数据流通、数据应用、数据运营和数据安全保障))之外,企业数据基础设施建设还需要充分考虑到 Al Agent 等大模型应用落地需求,在记忆存储、专家知识沉淀等方面提供支撑。

 

同时,AI Agent 与数据开发治理工具结合,在数据治理、数据运营等场景有非常丰富的落地潜力,能够极大提升数据开发效率,减少数据工程团队和数据运营团队的工作量,提升企业用户综合数据能力。

 

(3)AI Agent赋能现有数字化系统,让企业数字化建设真正落地:

 

现有数字化系统多数是从企业管理运营流程出发,服务于企业经营管理诉求。尽管有诸多数字化实践经验沉淀,但对于一线使用人员而言,很多数字化系统的操作体验并不友好顺畅,特别是针对某些流程处理、文档处理和表单填写。

 

大模型本身非常擅长处理文档等非结构化数据,Al Agent结合大模型、专家知识和企业内部各类组件工具,在文档处理、表单填写和流程生成处理上,有非常强大的处理能力,能够大幅提升数字化系统的使用体验和智能化程度,让业务人员能够更加便捷使用。

 

Al Agent能够沉淀用户行为数据和案例,在运营过程中,能够以极低成本实现企业内部各场景的专家知识积累和沉淀,每个用户在使用AI Agent处理日常工作时,自动化搭建个人知识库,可以实现部门内、部门之间和全公司的知识共享。

 

Al Agent在运行过程中持续沉淀案例,有助于企业用户积累不同场景及任务下的优质经验,实现组织内部的精细化管理,进而优化工作成果管控,相较于原有流程管控更有助于业绩提升,提升整体管理效率。

 

AI Agent在企业的运行流程

 

AI Agent在企业用户的运行流程分为问题澄清、分析拆解、智能决策、任务执行、观察结果、记忆存储等步骤。当前实际应用落地场景主要是问题澄清、分析拆解、智能决策、任务执行,少部分场景会涉及到观察结果和记忆存储。

 


问题澄清主要是意图理解,借助大模型能力,通过反问机制等方式,对齐问题理解,准确理解用户的意图。分析拆解主要是任务分解,将问题拆解成若干个子问题。智能决策是确定问题的解决方案和解决问题的顺序,一方面是利用大模型本身的任务规划能力,另一方面是通过调取知识库等方式获取过往经验。任务执行是调取各类工具组件进行执行。

观察结果和记忆存储是AI Agent未来能够发挥重要价值的关键。大模型泛化能力让AI Agent能够以极低成本持续迭代,通过持续积累案例,提升AI Agent的能力。传统人工智能应用(规则引擎、机器学习、小参数深度学习)的维护和迭代成本极高,这是限制人工智能在企业业务场景发挥重要价值的关键,而基于大模型技术的AI Agent天然具备突破限制的能力。