- 1、本文档共23页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Pip=AK
大模型趋势下的企业数据体系思考
何昌华 — — 数巅科技 CEO
InfoQ 极客传媒
数巅科技:让数据智能像水电一样简单
iP 三 人K
让大模型与企业数据充分协同
解锁数据潜力,释放企业数据价值
何昌华
DiP=AK 2022- 数巅科技CEO
2017- 国家级人才计划
蚂蚁集团
2017-
计算存储首席架构师
2015 Google 搜索引擎
架构核心技术负责人
2005-斯坦福大学博士
InfoQ 极客传媒
微调大模型 向量嵌入日日新 00MetaSaaS API
微调大模型 向量嵌入
日日新 00
Meta
SaaS API 开源大模型
大语言模型 (LLMs)
互动问答
信息抽取
图片生成 智能写作
智能咨询
智能运营
归因分析
据数时实
更新文件
视频监控
每日交易数据
行为日志
据数史历
存档文件
规章制度
历史日志
过往交易
非结构化数据
结构化数据
数仓、数据湖、数据中台
ICEBERG
InfoQ 极客传媒
大模型在企业落地对数据体系的关键需求
Contextual
data
Data Pipelines
数据加载和接入
→ Embeddin ode
eto Database
APls/
APls/ Plugins
Playground
Few-shot
examples
Orchestration
编排框架LLM
编排框架
LLM Cache
Logging/LLMopsApp
Logging/LLMops
App Hosting
Validation
LEGEND频繁数据交互链路
LEGEND
Gray boxes show key components of the stack,with leading tools/systems listed Arrows show the flow of data through the stack
Contextual data provided by app developers to condition LLM outputs
LLM APls and Hosting
Propeietary API Open API
Cloud Provider Opinionated Cloud
需求
需求
需求
统一数据资产
· 多模态数据需要多种加载、转换方法
· 需要管理及沉淀优质资 产
自动化工具(包括常用模型)
· 自动编排执行任务需要各种插件工具和
模型算法自动化驱动
高效计算能力
自动链路中数据频繁交互带来计算量倍增
alsz Enterprise
一世界顶流科技投行a16z 2023年6月发布最新大模型应用一般流程
InfoQ 极客传媒
业务数据资产
业务数据资产 数据虚拟化引擎
物理引擎
如何解决:智能数据虚拟化技术
统一
统
将异构数据源虚拟化,沉淀统一语义的数据资产
自动
根据业务语义实现资产即刻自动扩充,驱动自动化 工具
高效
智能加速实现数量级性能提升
InfoQ 极客传媒
全局智能优化数据虚拟化引擎全面实现三大需求
全局智能优化
数据源
HIVE
ICEBERG
My:
kafka
数据虚拟化引擎
统一数据资产
自动化工具
高效计算能力
数据场景
+ableau
直接面向业务的数据视图Power
直接面向业务
的数据视图
CO superset
OpenAI
虚拟层调用数据随取随用
虚拟层调用数据
随取随用
PostgreSQLDolly
PostgreSQL
数据资产收益分析统一的智能化任务编排
数据资产
收益分析
统一的智能
化任务编排
统一的自动
化数据管理
靠的数据访问
InfoQ 极客传媒
实现需求一 :统一数据资产 更多数据治理方案请关注7月22日 【智能化数据治理】 分论坛
数据接入 虚拟表批量映射,内置多模态存储加速
数据虚拟化层
K-V 存储格式 向量存储格式
外部数据接入图存储格式 列存储格式
外部数据接入
业务虚拟宽表 逻辑建模
快速灵活业务建模 贴源虚拟表
业务虚拟表
贴源虚拟表
自动血缘
Table1资产治理
Table1
资产治理
Col1
Table
Table3
Col1Table2
Col1
Table2
Col2
Col2
Col3
Col C
_Col4
_
TableC
Col C
_
虚拟中间表
SIVE
您可能关注的文档
- 2023小红书citywalk趋势报告-小红书-202307.docx
- AIGC浪潮下我们的关注方向-极客邦科技+杨攀.docx
- AIGC驱动的3D场景理解及医学图像解析-香港中文大学+李镇.docx
- QUIC协议在分布式系统架构中的实践-OPPO+李龙彦.docx
- TQUIC在腾讯的全场景优化实践-腾讯+谭奎.docx
- vivo数据集成稳定性与数据质量保障及可观测实践-vivo+易龙.docx
- 超越边界:FaaS的应用实践和未来展望-蚂蚁集团+邢奇.docx
- 从程序员焦虑话技术人能力进阶-酷家乐+万进舟.docx
- 从数据库历史看分布式数据库的架构设计趋势-泽拓科技+赵伟.docx
- 大模型时代生产力工具转型的技术探索-商汤科技+詹明捷.docx
文档评论(0)