近年来,大模型的能力边界不断拓展,为基于大模型的新应用、新服务、新业态夯实了坚实的技术基础。智能体作为大模型的重要应用形态,可以将大模型的技术能力转化为实际问题的解决能力,是打通业务场景和人类交互的桥梁。目前,智能体正逐步渗透到大模型应用的各个层面,有望重塑大模型产业生态,驱动人工智能产业变革。
中国信息通信研究院(以下简称“中国信通院”)人工智能研究所高度重视智能体技术及应用发展动态,联合业内近六十家单位共同编制《智能体技术要求与评估方法 第1部分:平台和工具》《智能体技术要求与评估方法 第2部分:技术能力》《智能体技术要求与评估方法 第3部分:应用服务》系列标准。同时,智能体国际标准——ITU-T F.TE-AIA: Requirements and evaluation methods of artificial intelligence agents based on large scale pre-trained model(基于大模型的智能体技术要求与评估方法)在国际电信联盟标准化局(ITU-T)第16研究组(SG16)全会上成功立项。标准聚焦行业高质量发展,综合评估智能体相关技术及应用能力,在促进产业发展、提升技术影响力和服务规范等方面具有重要作用。
2024年5月,上海澜码科技有限公司参与中国信通院组织的智能体首轮评估,顺利通过智能体平台和工具专项评估并最终获得4+级评级, 成为国内首批通过该项评估并获得当前最高评级的企业。此次评估,依据标准《智能体技术要求与评估方法 第1部分:平台和工具》开展,标准围绕智能体平台管理和运营、智能体开发和管理、API服务和管理三个方面构建智能体平台工具评价指标。其中,平台管理和运营关注智能体平台在账号管理、数据管理、安全管理等任务的支持度,智能体开发和管理关注智能体平台在开发、管理和市场等场景的能力,API服务和管理关注智能体平台在API服务、性能等方面的成熟度。
参与本次评估的澜码AskXBOT智能体平台在平台管理和运营、智能体开发和管理、API服务和管理三个能力域上均表现优秀。在平台管理和运营方面,参测平台具备较为全面的平台基础管理能力,保障平台的稳定性。在智能体开发和管理方面,参测平台支持以多种方式进行智能体开发,且管理体系较为完善。在API服务和管理方面,参测平台的API服务能力在响应速度、请求成功率、并发性、吞吐率等指标上均符合标准要求。
AskXBOT平台是澜码科技自主研发的基于大语言模型的企业级 Al Agent 平台,集Agent与Workflow的设计、开发、使用、管理、知识沉淀于一体,是企业高效应用AI能力的利器。以大语言模型为基石,平台拓展对接各类多模态模型,封装了丰富的工程化组件及算法策略,承载企业专家知识的同时作为连接人与系统的桥梁,可灵活适配各类复杂场景并提升智能体输出的准确性。通过平台开箱即用的应用、模版及多种智能体开发模式,业务人员或专业开发者均可基于平台快速定制自己的专属智能体来完成各类任务,在提升工作效率与质量的同时降低成本。为更好地服务企业客户,平台还提供完善的用户、权限、数据、资源等管理能力及安全策略,可持续为企业提供稳定服务,已助力金融、政企、零售、教育等领域多家企业完成AI智能体的落地应用。
中国信通院智能体首批评估工作持续进行中,欢迎各方单位参与。