大模型趋势下的企业数据体系思考-数巅科技+何昌华.docxVIP

大模型趋势下的企业数据体系思考-数巅科技+何昌华.docx

  1. 1、本文档共23页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Pip=AK 大模型趋势下的企业数据体系思考 何昌华 — — 数巅科技 CEO InfoQ 极客传媒 数巅科技:让数据智能像水电一样简单 iP 三 人K 让大模型与企业数据充分协同 解锁数据潜力,释放企业数据价值 何昌华 DiP=AK 2022- 数巅科技CEO 2017- 国家级人才计划 蚂蚁集团 2017- 计算存储首席架构师 2015 Google 搜索引擎 架构核心技术负责人 2005-斯坦福大学博士 InfoQ 极客传媒 微调大模型 向量嵌入日日新 00MetaSaaS API 微调大模型 向量嵌入 日日新 00 Meta SaaS API 开源大模型 大语言模型 (LLMs) 互动问答 信息抽取 图片生成 智能写作 智能咨询 智能运营 归因分析 据数时实 更新文件 视频监控 每日交易数据 行为日志 据数史历 存档文件 规章制度 历史日志 过往交易 非结构化数据 结构化数据 数仓、数据湖、数据中台 ICEBERG InfoQ 极客传媒 大模型在企业落地对数据体系的关键需求 Contextual data Data Pipelines 数据加载和接入 → Embeddin ode eto Database APls/ APls/ Plugins Playground Few-shot examples Orchestration 编排框架LLM 编排框架 LLM Cache Logging/LLMopsApp Logging/LLMops App Hosting Validation LEGEND频繁数据交互链路 LEGEND Gray boxes show key components of the stack,with leading tools/systems listed Arrows show the flow of data through the stack Contextual data provided by app developers to condition LLM outputs LLM APls and Hosting Propeietary API Open API Cloud Provider Opinionated Cloud 需求 需求 需求 统一数据资产 · 多模态数据需要多种加载、转换方法 · 需要管理及沉淀优质资 产 自动化工具(包括常用模型) · 自动编排执行任务需要各种插件工具和 模型算法自动化驱动 高效计算能力 自动链路中数据频繁交互带来计算量倍增 alsz Enterprise 一世界顶流科技投行a16z 2023年6月发布最新大模型应用一般流程 InfoQ 极客传媒 业务数据资产 业务数据资产 数据虚拟化引擎 物理引擎 如何解决:智能数据虚拟化技术 统一 统 将异构数据源虚拟化,沉淀统一语义的数据资产 自动 根据业务语义实现资产即刻自动扩充,驱动自动化 工具 高效 智能加速实现数量级性能提升 InfoQ 极客传媒 全局智能优化数据虚拟化引擎全面实现三大需求 全局智能优化 数据源 HIVE ICEBERG My: kafka 数据虚拟化引擎 统一数据资产 自动化工具 高效计算能力 数据场景 +ableau 直接面向业务的数据视图Power 直接面向业务 的数据视图 CO superset OpenAI 虚拟层调用数据随取随用 虚拟层调用数据 随取随用 PostgreSQLDolly PostgreSQL 数据资产收益分析统一的智能化任务编排 数据资产 收益分析 统一的智能 化任务编排 统一的自动 化数据管理 靠的数据访问 InfoQ 极客传媒 实现需求一 :统一数据资产 更多数据治理方案请关注7月22日 【智能化数据治理】 分论坛 数据接入 虚拟表批量映射,内置多模态存储加速 数据虚拟化层 K-V 存储格式 向量存储格式 外部数据接入图存储格式 列存储格式 外部数据接入 业务虚拟宽表 逻辑建模 快速灵活业务建模 贴源虚拟表 业务虚拟表 贴源虚拟表 自动血缘 Table1资产治理 Table1 资产治理 Col1 Table Table3 Col1Table2 Col1 Table2 Col2 Col2 Col3 Col C _Col4 _ TableC Col C _ 虚拟中间表 SIVE

文档评论(0)

4A方案 + 关注
实名认证
服务提供商

擅长策划,|商业地产|住房地产|暖场活动|美陈|圈层活动|嘉年华|市集|生活节|文化节|团建拓展|客户答谢会

1亿VIP精品文档

相关文档