AI 增强的数据工作流的元数据管理.pdfVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多

AI增强的数据工作流的元数据管理

JinjinZhaoSanjayKrishnan

j2zhao@skr@

UniversityofChicagoUniversityofChicago

Chicago,IL,USAChicago,IL,USA

摘要Intelligentagents;Knowledgerepresentationandreason-

ing.

AI增强的数据工作流引入了复杂的治理挑战,因为人

和模型驱动的过程都会生成、转换和消费数据工件。

这些工作流程融合了异构工具、动态执行模式和不透Keywords

明的模型决策,使得全面捕获元数据变得困难。在这LLM代理,ETL系统,出处,数据帧,文档检索

本项工作中,我们提出了TableVault,这是一个专为人类ACMReferenceFormat:

译AI协作数据创建设计的元数据治理框架。TableVaultJinjinZhaoandSanjayKrishnan.2025.AI增强的数据工作流的

中记录摄取事件,跟踪操作状态,将执行参数与其数据元数据管理.InProceedingsoftbd.(tbd.’25).ACM,NewYork,NY,

1来源链接起来,并暴露一个标准化的元数据层。通过USA,10pages./3735079.3735321

v结合数据库启发的保证和面向AI的设计,例如声明

41介绍

1性操作构建器和了解谱系的引用,TableVault支持跨

8

6混合人类-模型管道的透明性和可重复性。通过一个文数据生成的复杂性随着参与生成单一数据制品的框架、

0.档分类案例研究,我们展示了如何使用TableVault保系统和人员数量的增加而急剧增长。在经典的企业数

8持详细的谱系和操作上下文,即使在部分可观测执行据中,单个作者实体监督了整个数据集的生命周期,

0

5环境中也能实现强大的元数据管理。设计模式,建立收集协议,执行正确性标准,并且经常

2

:运行完整的分析管道。随着互联网的发展,半集中化

v

iCCSConcepts的数据集生产出现,组织开始利用外部资源来扩大其

x

r数据的规模、丰富性和时效性。网络爬虫、社交媒体监

a•Theoryofcomputation→Dataprovenance;•In-

控和亚马逊土耳其机器人等众包平台将新的参与者引

formationsystems→Storagemanagement;•Com-入到数据生成过程中。[12]。虽然这极大地增加了可用

putingmethod

您可能关注的文档

文档评论(0)

专业Latex文档翻译 + 关注
实名认证
服务提供商

专业Latex文档翻译,完整保持文档排版,完美处理文档中的数学公式和图表等元素,并提供 arXiv Latex 论文中文翻译。

1亿VIP精品文档

相关文档