Data×AI内部实践汇报.docxVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

腾讯DataxAI内部实践

目录

01内部实践背景及痛点

02内部实践实现思路

03内部实践落地挑战及解决思路

内部实践背景

及痛点

智能分析Agent内部实践背景及痛点

分析门槛高经营分析数据指标口径多且复杂,分析结论

分析门槛高

经营分析数据指标口径多且复杂,分析结论一般由

专业的经营分析师人工解读后输出给各业务部门及

老板,分析门槛高

需求响应时间长

如果有临时性的分析需求现有报表无法满足,则需要提需求让数据部门排期配置新的数据表和报表。

这个过程往往需要天~周级别,需求响应时间长。

缺乏知识沉淀不同分析场景的分析思路离散在各经营分析师脑海里,难以沉淀和复用

缺乏知识沉淀

不同分析场景的分析思路离散在各经营分析师脑海里,难以沉淀和复用

xx内部经营分析场景

xx在售卖各类云产品时,产生了收入、利润、

xx在售卖各类云产品时,产生了收入、利润、

成本等大量经营数据,各业务部门及老板需要

在经营分析系统上查看经营数据报表,来了解

经营情况

使用场景局限

原先经营分析系统由于逻辑较为复杂仅支持PC端如果在外需要临时查看数据很不方便

内部实践实现思路

智能分析Agent实现思路:通过大模型实现对话式分析,大幅提升分析效

自动化解读和归因通过大模型自动对数据结果进行解读和归因,输出分析结论,解决原先强依赖经营分析师人工解读,分析门槛高的难题问答式分析小白都会用

自动化解读和归因

通过大模型自动对数据结果进行解读和归因,输出分析结论,解决原先强依赖经营分析师人工解读,分析门槛高的难题

问答式分析小白都会用

通过大模型实时问数

用户提问后通过大模型实时生成查询语句并出数,解决临时需求多需要排期的问题

沉淀知识库

沉淀知识库

构建经营分析知识库,沉淀使用过程中遇到的业务黑话、计算逻辑、潜在分析思路等,让小白也能复用沉淀知识快速进行数据分析

搜索引擎自动化解读总结数据情况并给出业务建议内置业务归因模型

搜索引擎

自动化解读

总结数据情况并给出业务建议

内置业务归因模型

可一键定位指标波动根因

精简交互逻辑构建移动端

原先拖拉拽字段进行数据分析的方式优化成对话式分析,交互逻辑大大精简,构建移动端变得可能,能满足外出问数场景

内部实践落地挑战

及解决思路

挑战1:复杂计算及方言适配问题

NL2DSL为主,NL2SQL为辅(新方案)

NL2DSL为主,NL2SQL为辅(新方

案)

示例:2024年10月XX云BI收入同比变化多少?

大模型先生成

QQ案)

Q

Q

示例:2024年10月XX云BI收入同比变化多少?

大模型直接生成

SELECT

SELECTDATE_FORMAT(`ftime`,%Y-%m)AS`定账月`,年同比增长率(SUM(`shouldincome_after`))AS`收入(不含税)的同比变化率`FROM`CSIG经营数据`WHERE

`prod_class4_name`IN(xx云BI)AND`ftime`=

2024-10GROUPBY`定账月`ORDERBY`定账月`ASCLIMIT10000

挑战:

1、复杂计算易出错:同环比等计算需要生成的

SQL语句较为复杂,此时NL2SQL容易在时间转换函数、格式上出错;

2、SQL方言问题:经营分析数据存放在

Clickhouse里,而大模型生成标准SQL的准确率较高,转换成Clickhouse后就容易出错。

指标:收入

计算方式:年同比

条件:产品名称=xx云BI、时间=2024年10月BI系统再转换成SQL

亮点:

1、降低大模型生成难度,模型只需给出BI系统需要的元素,由BI系统转换成SQL再执行,大大提升了整体准确率;

2、大模型无需处理方言转换,直接复用BI系统兼容SQL方言能力;

3、如果需要基于数据表原始字段计算后得到新字段才可回答,大模型会生成SQL片段,塞入BI的计算字段内,例如表里有利润和收入时用户询问利润率,这种方案即有NL2DSL的稳定性,又兼顾了NL2SQL的灵活性。

挑战2:经营分析数据指标口径多,用户提问口语化严重

解决方案:

新增意图澄清模块,当问题存在时间、字段、取值不明确等情况时,主动触发让用户明确意图,而不是将模糊信息传递下去,让大模型去“猜测揣摩”用户意图Q

新增意图澄清模块,当问题存在时间、字段、取值不明确等情况时,主动触发让用户明确意图,而不是将模糊信息传递下去,让大模型去“猜测揣摩”用户意图

1、经营分析数据指标口径多,仅收入就有收入(含税)、收入(不含税)等10多种口径,大模型难以

1、经营分析数据指标口径多,仅收入就有收入(含税)、收入(不含税)等10多种口径,大模型难

文档评论(0)

情报猿 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档