澜码CEO周健受邀出席长三角大会,探索Agentic AI发展新范式

人工智能作为科技发展的创新力量,正以前所未有的速度渗透各行各业,引领着新一轮的产业革命。

 

9月20日,2024长三角人工智能与算力协同创新发展大会在杭州举行,大会由浙江图灵研究院、中关村智用人工智能研究院、新智引擎共同主办,汇聚4位重量级院士,多位政府领导及人工智能领军企业代表,共同探索人工智能与算力融合的创新范式。

 

作为国内探索AI Agent落地的先行者,澜码科技创始人兼CEO周健受邀出席大会并发表演讲,分享企业级AI智能体落地的实践与碰撞。

 

 

如何提升AI Agent在复杂业务场景中的准确率

 

当前,大模型正以较快的速度发展和迭代,目前主要分为三大类型:纯文本模型,多模态模型和全实时、端到端模型。纯文本模型已形成了较为清晰的分层体系,如用13B、72B模型即可达到信息提取、指令遵循等;多模态模型和端到端模型的推理能力有待提升,目前并没有到达关键节点。

 

而近期OpenAI发布的o1模型,重新定义了代码和计算方式,虽然其局限于纯文本领域,但打开了大模型推理能力的天花板,这代表着推理能力基本上可以依靠大模型来完成。同时也意味着,o1模式下,推理的算力成本又将进一步攀升,大模型的学习、预训练成本依旧高昂。此外,目前的大模型,包括o1实际上都不具备自主反思的能力,大模型如何用更低的价格实现大模型学习能力的提升?如何从历史已完成的任务中反思、改进行为模式?这依旧是未来使用大模型所面临的难题。

 

“大模型本身不具备感知和改变环境的能力,而AI Agent是能够感知环境,基于目标进行决策并执行行动的智能化应用,能够在数字世界拆解和完成任务。Agent技术的核心在于与环境的互动。从Agent的角度,能否适应越来越开放、复杂的环境,是通往AGI之路所面临的巨大挑战。”周健说。

 

在实践落地过程中,面对一些复杂业务场景问题,澜码形成了一套综合、高效的系统化RAG(Retrieval-Augmented Generation)方案。传统的RAG方案并不涉及到专家知识,直接把问题用Embedding 技术转换为向量数据,而澜码的RAG方案强调对于用户问题的反问、改写、拆解、总结,以及文档的深度处理。

 

在面对用户提问时,澜码会使用大模型及Feature的方式对用户问题进行强拆解。例如:“北京银行跟招商银行成立日期哪个早?”将问题拆解为1、北京银行什么时候成立?2、招商银行什么时候成立?3、哪个日期更早?再通过反问确认,短时记忆及多轮对话的方式,准确地回答用户的问题。

 

在文档处理层面,文档的发布通常承载着特定目的,同时包含很多的细节和结构化信息。例如,在公安部门需要合并民众办事指南的项目中,专家知识指哪些事项由哪些机构负责,国家、省、地方法案具体是如何规定等。其中,由于存在新旧法案更替的情况,新法案的颁布,若是与旧法案发生冲突,该如何解决?这些都是很深的专家知识,专家能够从底层的政策文档中抽取关键信息,AI Agent通过强化拆解与精细化的文档处理,能够大幅提升企业内部问答的准确率,确保信息的精确传递和高效应用。

 

 

 

除了RAG方案,澜码还在探索增强式数据分析(Augmented Business Intelligence)的应用实践。

 

我们对ABI的探索经历了三个阶段:Text to SQL,Text to Metrics,Text to Object。

 

第一阶段运用大模型的自然语言能力直接生成SQL,但准确率较低,无法满足复杂化、多样化的需求;

 

第二阶段通过指标库的方法确保AI对问题的准确理解,此时对用户的提问有严格的要求,容错率较低,不够灵活;

 

而进化到第三阶段,澜码自主构建了一个小模型,可以发挥Semantic Parser的主要作用,即基于语义的分析,能够在特定业务领域获取数据治理的信息后,通过自然语言实现模型命名、实体识别等的区分,并用不同颜色表现,当用户在输入时对话框会跳出前、后缀匹配的字、词,从而更准确地理解句子中的每个词的语义,对应匹配到底层的数据库,进而生成准确率较高的图表。

 

以上两种方式,是澜码目前在落地众多项目过程中实现交付的核心能力。在澜码目前落地的项目案例中,基于现有的开源模型,我们基本能够实现端到端高达95%以上的准确率,帮助企业提高业务质量和效率。

 

Agentic AI产品架构及未来设想

 

OpenAI提出了5级AGI(通用人工智能)分类体系,层级由低到高分别是:

 

基于大模型的信息提取和指令遵循能力,具备基本的对话和交互能力的L1;

 

拥有强大推理和问题解决能力的L2,这一级别的AI能够像人类一样分析问题、制定解决方案,甚至在某些领域超越人类;

 

能够独立思考、并根据复杂情境采取行动,显示出接近人类的自主决策能力的L3,在此阶段能够实现人机协同工作;

 

具有创新思维和创造力的L4,协助人类进行发明创造;

 

具备全面人类智能和组织能力的L5,基本可以替代人类,是AGI发展的最高级别。

 

 

当前,o1模型的推出把AGI的发展从L1提升到L2的层次,这无疑将加速AI应用在刚需场景的落地。o1模型的推理能力是其核心竞争力,尽管它需要分钟级别的时间来完成任务,但对于在办公室工作的人类来说,分钟级别的响应速度已经相当迅速。虽然使用o1模型的推理成本依旧高昂,可能比雇用一个博士生更贵,但其生产出来的东西或许能够指导百个、千个甚至是万个72B的Agent,此时效益考量的标准就不在个人,而是团队,成本的效益曲线可能会发生变化。

 

我们认为,从业务流程的视角来看,大模型或者Agent应用主要用来增强企业内的业务任务、业务活动、业务流程,未来,随着大模型的发展,Agent有可能发展为替代业务团队的角色。

 

 

目前,在澜码的Agentic AI产品架构中,底层是一套工作流系统,它定义了先做什么后做什么的确定性流程。我们在此基础上封装了爬虫、ABI、OCR或ASI等技术,但本质上,这些都是遵循一定顺序的确定性工作流。

 

往上一层,是对话流。主要解决的,是一些较为复杂的业务,靠用户一句话无法清晰表达、需要与用户进行多轮对话来理解和澄清用户需求的场景。

 

至此,这里还是确定性的业务任务执行。

 

再往上一层,就进入了业务活动的编排阶段。以银行场景为例,对公客户经理的产品营销就是一项业务活动。该业务活动可以被拆解为:售前的客户需求挖掘和售中的产品个性化配置等业务任务。这些业务任务又可被拆解成多个业务步骤,如客户画像分析、常见产品问题回答、客户需求识别、产品个性化配置以及表单智能填写等。

 

 

“未来,基于其强大的推理能力,o1模型可以作为澜码在业务活动编排中,预测下一个行动应该是什么的模型基座。它的推理能力能够很好地解锁更多的业务场景,也能够提高专家赋能基层业务单位的水平。澜码的AI Agent平台包含知识中心、学习中心、交互中心和行动中心,在此基础上,构建起专家辅导之下能够跟用户交互解决问题的新一代智能体。这是目前我们正在设想和规划的下一代产品。”周健说。