澜码联合爱分析发布《中国AI Agent市场研究》,探索AI Agent发展新趋势
AI Agent作为人工智能领域的新兴技术,正在成为赋能千行百业数智化转型的关键力量。

8月20日,澜码科技联合爱分析举办“颠覆传统,AI Agent 推动企业数智化新革命”线上发布会,正式对外发布《2024爱分析·中国AI Agent市场研究报告》。报告全方位剖析了AI Agent在不同行业落地的场景、流程、关键要素和价值,并分享多个优秀实践案例,为AI Agent未来的发展与落地提供借鉴和参考。(报告快速获取:https://www.ifenxi.com/research/content/6654

发布会上,澜码科技创始人兼CEO周健就《基于LLM架构的AI Agent平台的现状和未来预测》进行了主题演讲,回顾了澜码科技过去十八个月中AI Agent落地的实践经验,并对未来大模型、AI Agent应用以及企业数智化变革的趋势分享了深刻的见解。

大模型能力与专家知识决定了AI Agent的性能

 

在过去一年半的实践中,我们发现,AI Agent的成熟度依赖于大模型的能力,包括开源和闭源模型,以及多模态模型等。

 

随着大模型能力的不断扩展和成熟,它们在信息抽取、指令遵循等任务执行能力得到提升,使得基于大语言模型的AI Agent的水平也远超传统的自动化系统,成为企业的“数字员工”。

 

“作为一家‘模型中立’的AI Agent公司,澜码拥有内部测评工具,能够在特定场景下针对不断更新的开源大模型进行实时评价,为企业客户在选择合适的应用场景和模型时提供有价值的决策建议。此外,我们认为在企业级应用场景下,专家知识对大语言模型落地至关重要,大模型是底座,专家知识是天花板。”周健说。


我们认为,大模型本质上是一种通用工具,类似于不同教育背景的毕业生,无论是高中生、大专生还是大学本科生,参加工作都需要接受特定的入职培训,以获得财务、公司经营等特定方面的知识和技能。因此,需要AI Agent基于企业内的业务流程、数据构建专家知识库,从而赋能大模型能够解决复杂场景的复杂问题。

例如,在知识问答场景中,大模型更多是强调上下文能力,但这并不意味着员工只要掌握了所有相关的政策法规和公司情况就能胜任工作。除了表面的显性知识,如规则性和事实性知识,还有难以用自然语言描述的过程性知识、领域性知识与社会性知识。这些隐性知识需要专家的洞察力来识别和提供关键信息,这是自动化系统所无法替代的。

以保险经纪行业为例,智能核保和产品推荐流程复杂,通常需要医学专业人士进行人工核保,而对于受教育程度一般的、非医学背景的业务员需要进行专业的知识培训,不仅成本高且效率较低。

 

针对这种情况,澜码科技提出了以专家知识为核心的智能核保和营销辅助解决方案,对保险产品和健管服务资料做文档预处理,提取用户体检报告中的关键信息,并仿照专家的分析过程构建了一个AI Agent(专家分身),能够快速解读数据,将专业内容转化为一般用户和保险业务员易懂的语言,帮助业务人员为客户推荐合适的保险产品和健康管理服务。


我们在过去一年多丰富的实践经验中,探索出了当前AI Agent落地的方法论:

首先,需要通过用户问题收集样例数据,利用大模型(如GPT-4)进行扩写,以此增强模型对不同情况的泛化能力。

其次,根据客户的需求选择合适的模型,如13B、72B或GPT-4,并利用扩写后的数据评估模型的准确率和算力需求。

最后,在应用部署完成后,通过实际使用中的反馈对模型进行调试和优化,确保其在特定特定场景下能够高效且准确地运行。


落到企业内部,大模型的出现也为企业的IT基础设施带来了新的变革。在这个新的生态中,算力和AI基础设施,包括推理加速和模型管理服务等位于底层,在其之上是模型层,AI Agent作为中间层,需要具备针对特定场景匹配合适的大模型、调度不同工具的能力,以达到连接人和系统的目标。

澜码科技在数据、文档、商品分析和推荐、营销等方面有大量的POC和项目落地,积累了大量实战场景下Agent原子能力的表现数据,因此更加了解在不同场景下的模型的表现和效果,可根据不同场景需求调度平台的能力,如RAG、ABI、多Agent协作等,帮助企业解决实际业务问题。

未来AI Agent将实现自治,重塑企业组织结构

从模型的智能化水平与成本效益角度来看,目前大模型的能力还处于“高中生”水平,预计明年年底,可能会出现“博士生”水平的模型。在目前的就业市场中,刚毕业的高中生与博士生的薪资差距大约是两倍,但大模型落地所产生的算力差距是十倍、百倍、甚至是千倍。像GPT-4拥有1.8万亿参数,其庞大的参数量本身就是为了实现更优的性能,这也意味着参数本身代表着更好的模型效果,同时也会带来成本的大幅提升。


未来,随着大模型如“GPT-5”的发展,它如果能够跟管理者互动,帮助管理者扩大管理半径,这个规律可能就会被打破。

这时的考量单位就不再是单个模型,而是团队整体。团队结构变为一个专家加上100个数据员工再加上一个Agent,相比于10个专家与100个数据员工的配置,成本效益曲线可能会发生变化。从这个视角上,未来Agent或许能够从原来的辅助人到实现自治,能够自主形成一个团队,这将改变其在组织中的价值和作用。

现有的企业组织通过结构、人员、技能和流程来运作,并通过数字系统记录这些流程。而AI Agent在这一过程中可以与人协作,进一步优化组织结构和流程。

通常情况下,一线员工从新手到高级新手的过程中需要耗费大量的时间进行案例查询,而Agent能够通过RAG、API、ABI等方式辅助员工更好地执行;而从高级新手到胜任者的下一阶段,关键在于积累实践经验和学习案例,这对Agent的场景记忆提出了更高的要求。


“未来,我们期望AI Agent能够通过仿真和推演,帮助专家级人员无需亲自实践就能获得经验,让AI Agent能够提前封装业务能力、应用能力、数据能力和分析能力,能够提供更深入的数据洞察,并基于此提供系统操作能力,这种能力将改变企业内部未来的组织结构。

我们也期待在接下来的18个月内,基于底层的大模型,如文本模型、多模态模型和实时模型,构建一个具备知识推理、记忆和反思能力的AI Agent系统,这个系统将助力企业进行知识管理和自动化升级,加速知识的更新迭代,并推动组织运作方式的创新。”周健说。