史鑫鑫_金融领域大模型数据集管理与应用.pdfVIP

  • 0
  • 0
  • 约1.06万字
  • 约 35页
  • 2025-05-29 发布于山东
  • 举报

史鑫鑫_金融领域大模型数据集管理与应用.pdf

演讲人:史鑫鑫

蚂蚁集团/大安全数据研发专家

01引言与背景

02智能数据管理

03CoT思维链数据工厂

04多模态数据管理与应用

05业务场景应用案例分享

06总结与展望

01

人工智能的三架马车

结构化非结构化TransformerA100其他

图片音频VisionTransformerH100

DiffusionTransformerH800

视频

MoE

数据算法算力

小模型到大模型的变迁

小模型大模型

模型LLMVLLMMoE

策略业务知识专家经验

知识业务数据

模型NNCVXGBoost作案手法用户特征交易时间

数据业务知识对手特征支付方式

特征用户交易设备策略设备行为序列

法律法规网络…

Data-CentricAI

Data(V1)

DCAI(Data-CentricAI)是一种大模

型研发范式,其以高质量数据集为核心

Data(V2)迭代大模型的性能。

Data(V3)

金融大模型数据

交易数据用户数据

交易方、商品、时间、地点性别、年龄、常住地

设备数据业务知识

型号、OS、网络法律法规、作案手法

➢业务复杂、数据分散在不同的业务场景、数据看不全、看不清

➢数据存在孤岛、重复使用困难

➢数据存储和计算与大模型训练平台之间链路长、应用效率低

➢在重点业务场景,数据精细化运营困难

02

关键问题

➢看清、看全业务数据✓以数据集、数据专题的数据管理能力

➢打

文档评论(0)

1亿VIP精品文档

相关文档