多维摘要代理在企业表格上的上下文感知推理.pdfVIP

  • 0
  • 0
  • 约1.11万字
  • 约 9页
  • 2025-10-14 发布于北京
  • 举报

多维摘要代理在企业表格上的上下文感知推理.pdf

多维摘要代理在企业表格上的上下文感知推理

AmitDhanda∗

Amazon,amdhanda@

摘要

本我们提出了一种新的框架,用于使用基于大型语言模型(LLM)的代理跨多个维度总结结构

化企业数据。传统的表格到文本模型往往缺乏跨越层级结构和上下文感知差异进行推理的能力,

译这些能力在商业报告任务中至关重要。我们的方法引入了一个多代理管道,该管道利用切片、方

中差检测、上下文构建和基于LLM的生成代理来提取、分析和总结多维数据。结果显示,所提出

1的框架优于传统方法,实现了83%的数据忠实度,显著变化的优越覆盖率以及决策关键洞察的

v高度相关性得分(4.4/5)。改进在涉及微妙权衡的类别中尤为明显,例如由于价格变动而在单位

6

8销量下降的情况下增加收入,其他方法要么忽视这些问题,要么仅以有限的具体性进行处理。我

1

7们在Kaggle数据集上评估了该框架,并展示了与基准表格总结方法相比,在忠实度、相关性和

0洞察质量方面的显著改进。

.

8

0

51介绍

2

:

v

i企业依赖结构化数据,各行各业的企业都在构建数据仓库和商业智能平台方面进行了大量投

x

r资。这些数据系统通常是多维度且高容量的,其洞察力通常通过仪表板和高管摘要来获取。然而,

a

将原始结构化输入转换为人类友好的解释仍然是一个重大挑战。分析师花费大量时间准备业务回

顾,综合不同类别和时间段的变化,并针对领导层受众定制信息。

自然语言生成(NLG)有望实现从行和列到叙述性解释的自动化翻译。然而,企业对NLG的

应用需要忠实度、领域意识和维度背景,而许多端到端模型缺乏这些特性。平面表格转文本管道无

法考虑到地区、时间和产品类型等维度之间的交互作用。此外,它们通常忽略元数据和对于可操作

决策至关重要的趋势信号。

尽管结构化数据在企业报告中普遍存在,但挑战在于如何将这些丰富的多维输入自动翻译成

忠实、有见地且适应不断变化的业务环境的叙述。传统的BI工具缺乏语义理解能力,而端到端的

LLMs倾向于在没有精确指导的情况下产生幻觉或忽略关键指标。弥合这一差距需要一种结合结构

化数据处理和生成语言功能的混合方法。

∗Preprint.AcceptedatICDATA2025;toappearinSpringerNature.Thisworkwascompletedindependently

anddoesnotreflecttheviewsorpositionsofAmazon.

1

大型语言模型(LLMs)在生成流畅文本方面显示出潜力,但将其应用于结构化、多维数据仍

然非trivial。关键挑战包括幻觉问题、缺乏时序推理能力以及无法引用特定的表格切片。此外,现

有的端到端LLM摘要系统不是模块化的,这限制了可解释性和控制。

在本文中,我们介绍了一个结合符号推理与LLM生成的多代理框架。通过将摘要分解为子任

务——切片、方差计算、上下文丰富和生成——我们实现了更好的可解释性、忠实度和灵活性。这

种模块化管道能够动态地针对执行需求进行定制化的摘要生成,同时依然基于实际的数据差异。

2相关工作

数据汇总。通用数据汇总已在统计和机器学习文献中通过聚类、降维和基于规则的摘要生成器

等方法进行了探讨。最近,神经网络摘要模型将这些想法扩展到了结构化输入,包括表格和关系数

据库。诸如Data2Text和DataTuner之类的方法旨在从数据中合成特定领域的叙述,但通常需要

微调并且缺乏模块化的适应性。我们的工作建立在这一基础上,但特别关注多维表结构和模块化代

理编排,以支持上下文感知、忠实且可解释的摘要。

表格到文本生成。相关工作包括ToTT

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档