引言
在由数据驱动的商业世界中,“大模型+数据分析”的结合已经成为企业和组织获取竞争优势的关键,不仅仅是技术进步的象征,更是推动各行各业创新和转型的重要抓手。
《2024中国“大模型+数据分析”最佳实践案例TOP10》榜单汇集了来自不同行业“大模型+数据分析”落地应用,从金融科技到零售消费,从智能制造到智慧城市建设,不仅展示了如何利用先进的大模型和数据分析技术来解决现实世界中的复杂问题,而且为行业同仁提供了宝贵的经验和启示。
我们希望通过这份榜单,让读者一窥大模型在数据分析中的无限潜力,了解它们如何帮助企业优化决策、提升效率、创造新价值。同时,我们也希望激发读者的灵感,鼓励他们在自己的工作中探索和应用这些先进的技术和方法。
在这份榜单中,每一个案例都是经过严格筛选和评估的,它们代表了当前大模型在数据分析领域的最佳实践。我们诚邀每一位读者,不仅阅读这份榜单,更在自己的数据分析工作旅程中,不断探索、实践、创新。让我们一起见证并推动大模型在数据分析领域的进步和发展。
01
大模型将改变数据消费方式,释放数据生产力
第一,自然语言处理和理解。大模型能够以接近人类的水平理解和处理自然语言,能够帮助用户更快速、更准确地解析和理解大量的非结构化数据,例如文本数据、用户评价、社交媒体内容等。
第二,自然语言交互形式。非技术人员能够通过自然语言查询获取所需数据和分析结果,同时提供清晰的数据解释和可视化,帮助用户更好地理解分析结果和数据洞见。
第三,识别模式、相关性和关系。大模型擅长在大量数据中揭示复杂的关联,能够基于现有数据进行智能推理和预测,这种能力对于准确预测市场趋势和理解消费者行为至关重要。例如,通过分析历史销售数据来预测未来销售趋势。
第四,代码生成和自动化。大模型能够自动生成代码,帮助数据分析师快速创建数据处理和分析的脚本,可以显著提高数据分析的效率和准确性,同时降低数据分析的门槛,使得非技术背景的人员也能够进行数据分析。
第五,支持自动化和实时分析。大模型通过自动执行重复、耗时的任务来简化数据处理。因此,提高员工对数据结果的反映效率。这一功能可进行实时分析,为企业提供及时的数据洞察,可以快速灵活的应对市场变化。
第六,数据处理的可扩展性。大模型能够高效地管理和分析日益增长的大型数据集,对于数据量高速增长的企业至关重要。这种可扩展性确保了一致的性能和从大量信息中提取洞察的能力。
基于以上能力,大模型在数据分析领域的应用可分为生成类和决策类:
• 生成类应用:这类应用主要利用大模型的生成能力,自动化地创建数据内容和报告,创造性地提供数据分析视角;
• 决策类应用:这类应用主要利用大模型的分析和决策能力,侧重于提供决策支持,帮助用户基于数据分析做出更加明智的业务决策。
这两类应用展示了大模型在数据分析中的多样化能力,它们不仅提高了数据分析的效率和便捷性,还增强了数据分析的深度和广度,帮助企业更好地理解和利用数据,从而做出更加精准的业务决策。
当前,生成类应用的落地速度较快、效果较为明显,决策类应用相对较慢。在本次入选的“大模型+数据分析”最佳实践案例TOP10中,大部分案例属于生成类应用。
如何将大模型能力很好地融入到企业的现代数据堆栈、数据管道和数据分析工作流程中,是企业落地“大模型+数据分析”时面临的难题。
当前,不同企业根据自己的数据基础设施现状、技术能力等采取了不同的设计思路。一种主流的设计思路如下:
• 用户以自然语言的方式说出业务需求,大模型①(擅长语义理解)自动对问题作出建议和提炼,提炼后的问题会发送给聊天机器人;
• 聊天机器人使用大模型②(擅长NL2SQL)构建SQL查询,通过提前定义的语义层,完成指标定义、管理、访问等工作,提升数据口径一致性;
• 提取好的数据交由大模型③(擅长总结归纳)处理,生成自然语言回复,同时可视化引擎可输出可视化报表。
这种对话式的数据分析可以让用户以自然语言进行数据查询,还可以与数据可视化功能相结合,为任何用户(即使是非技术人员)赋予与数据交互的能力。而且当与图形生成功能结合使用时,可以改变用户的分析体验,简化数据和分析工作。
数据查询的效率和准确性很大程度上取决于数据的质量和完整性,但大部分企业的数据分散在各种系统中,企业在数据方面的基础设施还无法支持完整对话式数据分析的实现。因此,企业应该尽快加大对数据管理的投资,使大模型可以轻松集成所需的企业数据。企业应做好数据认责、确权、口径、定义等工作,保证数据资产目录清晰,有助于模型理解数据资产,使大模型在理解业务勾稽关系时更靠谱。
目前大模型在数据分析场景的落地目前还处于早期阶段,未实现大规模应用,但这一场景的增长速度比大多数场景都要更快。为了获得更好的投入产出,企业在探索这一场景之前,需要明确以下问题:
• 用户:谁将使用数据分析工具?主要是面向专业的数据分析师团队,还是面向更多数据能力相对较弱的普通用户?
• 行业要求:根据企业所在行业的政策和监管要求,企业使用的数据分析工具是否需要符合特定的法律法规?例如对于出海企业,使用的工具如果涉及到数据跨境传输需要格外谨慎。
• 跨部门用例:哪些部门将使用数据分析工具?该工具是否适用于企业的所有用例?
• 数据洞察量:计划每天、每周和每月产生多少数据洞察?
• 数据展示要求:需要向谁展示数据洞察结果?是否需要以特定的仪表盘或可视化方式展示结果?展示结果的频率如何?
• 速度:需要多快的生成洞察?
• 准确性:企业可以接受的数据分析结果准确率是多少?
• 培训:员工需要接受多少培训才能有效使用该工具?
明确以上问题有助于帮助企业建立相关的关键绩效指标,并选择最佳的数据分析工具和技术路线来实现这些目标。
02
2024中国“大模型+数据分析”最佳实践案例TOP10评选结果
03
入选案例介绍
案例方/供应商:中银消费金融有限公司/上海澜码信息技术有限公司
应用领域:金融
案例详情:
中银消费金融 Text To BI Agent基于澜码的企业级AI Agent平台AskXBOT打造而成,提供数据查询、数据分析、可视化图表等核心功能,旨在提高数据使用效率,降低数据查询的门槛,让任何人都能通过对话查询和探索数据,让更多的员工参与到数据驱动的决策过程中来。
入选理由:
• 中银消费金融通过Text To BI Agent,显著提升了业务人员获取和分析数据的效率,优化了决策质量。该平台通过提供无缝的数据查询、分析和可视化体验,降低了数据查询的门槛。这种以数据为核心的业务运营模式,不仅提高了业务效率,还推动了公司业务的成长和发展,具有很高的价值性;
• 通过【指标知识库】方案,Text To BI Agent解决了由于数据量大、字段过多、数据结构/逻辑复杂等问题导致的模型理解、推理能力下降,严重影响输出效果、用户体验的困境,为其他企业提供技术参考。
04
核心评价维度
本次评选从价值性、实用性、创新性、示范性四个维度对案例进行定性与定量评价:
• 价值性:该案例促进企业商业目标的实现,提供了明确的商业价值,或者该案例具备社会价值,积极解决重要社会问题,对社会产生积极影响;
• 实用性:该案例的实施带来显著效果,在实际应用中表现出色,为企业和用户创造实际价值;
• 创新性:该案例具备独特的解决方案,彰显了技术创新的卓越性,引领行业发展,为市场注入新的创新动力;
• 示范性:该案例对同行业或其他行业大模型技术应用的开展和能力建设具有参考和借鉴意义。