- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE
PAGE 1
财务大数据 课程单元设计
授课时间
第 2周 共 2节
课次
1
授课方式
(请打√)
理论课√ 讨论课√ 实验课□ 习题课√ 其他□
课时
安排
2
授课题目(教学章、节或主题):第四节:大数据数据建模
教学目的、要求(分掌握、熟悉、了解三个层次):
知识目标:熟悉大数据数据建模的方法。
能力目标:1.熟悉E-R建模方法。
2.掌握维度建模方法。
3.熟悉Data Vault建模方法。
4.了解Anchor建模方法。
教学重点及难点:
E-R建模方法
维度建模方法
Data Vault建模方法
教 学 基 本 内 容
方 法
手 段
任务一、课前预习
一、利用职教云APP预习教学课件;
二、针对预习内容提出问题,在职教云APP中提出问题,做好笔记;
任务二、课堂面授
?大数据的数据模型的概念
数据模型就是数据组织和存储方法,它强调从业务、数据存取和使用角度合理存储数据。
只有数据模型将数据有序地组织和存储起来后,大数据才能得到高性能、低成本、高效率、高质量的使用。
? 性能方面:良好的数据模型能帮助我们快速查询所需要的数据,减少数据的I/O吞吐。
? 成本方面:良好的数据模型能极大地减少不必要的数据冗余,也能实现计算结果复用,极大地降低大数据系统中的存储和计算成本。
? 效率方面:良好的数据模型能极大地改善用户使用数据的体验,提高使用数据的效率。
? 质量方面:良好的数据模型能改善数据统计口径的不一致性,减少数据计算错误的可能性。
经典例题:
【例题?多选题】
良好的数据模型能带来大数据分析哪些方面的改变?
性能方面 B.成本方面 C. 效率方面 D.质量方面
『答案解析』 ABCD
?大数据的数据建模的方法
常用的数据建模方法有:ER模型,也就是E-R模型;维度模型、Data Vault模型、Anchor锚模型。
E-R模型
E-R图也称实体-联系图,提供了表示实体类型、属性和联系的方法,用来描述现实世界的概念模型。
E-R建模步骤分为三个阶段:高层模型、中层模型、物理模型。
维度模型
维度建模从分析决策的需求出发构建模型,为分析需求服务,因此它重点关注用户如何更快速地完成需求分析,同时具有较好的大规模复杂查询的响应性能。
维度建模的典型代表是星形模型,以及在一些特殊场景下使用的雪花模型。
Data Vault模型
Data Vault模型强调建立一个可审计的基础数据层,也就是强调数据的历史性、可追溯性和原子性,而不要求对数据进行过度的一致性处理和整合;同时它基于主题概念将企业数据进行结构化组织,并引入了更进一步的范式处理来优化模型,以应对源系统变更的扩展性。
Anchor模型
Anchor对Data Vault模型做了进一步规范化处理,其创建者的初衷是设计一个高度可扩展的模型,其核心思想是所有的扩展只是添加而不是修改,因此将模型规范到6NF,基本变成了k-v结构化模型。
经典例题:
【例题?单选题】
E-R模型中,菱形代表的含义是?
A. 实体的属性 B.实体 C.实体之间的关系 D.实体的值
『答案解析』 C
【例题?判断题】
E-R模型的实施周期非常短,容易快速上手。
『答案解析』 False
【例题?判断题】
维度模型重点关注于让用户如何更快速地完成需求分析。
『答案解析』 True
【例题?多选题】
维度模型的特点有哪些?
A 快速上手 B快速交付 C数据冗余量小 D非常灵活
『答案解析』 AB
【例题?判断题】
Data Vault模型可直接用于数据决策分析。
『答案解析』 False
【例题?判断题】
Anchor遵循3NF范式。
『答案解析』 False
【例题?判断题】
Anchor模型的组成有哪些?
A. Anchors B.Attributes C.Ties D.Knotes
『答案解析』 ABCD
任务三、职教云在线随堂测验(单选、多选、判断)
根据本节课程的知识点,随机抽取5道题,进行随堂测试。
线上线下混合教学(智慧职教、职教云、理实一体化综合实训室)、任务驱动、教授法、各小组讨论、数字一体化教材、PPT展示、小组代表发言、课堂练习、教师总评
作业和思考题:
完成本节课知识点训练
课后小结:
一、大数据的数据模型概念
1.良好的数据模型可促成决策分析时性能、成本、效率、质量等方面突出
2.大数据的数据模型概念
二、大数据特征选择和特征提取
1.E-R模型
2.维度模型
3.Data Vault模型
4.Anchor模型
您可能关注的文档
- 房地产开发与经营 项目的建设管理与验收 案例11-2:阳光雅居项目验收交付标准.doc
- 房地产营销与策划 房地产项目产品组合设计与优化 房地产项目产品组合设计与优化.docx
- 房地产营销与策划 房地产营销与策划 2012房地产调研报告房地产.doc
- 房屋构造 台阶坡道、电梯 14台阶坡道、电梯与扶梯.docx
- 纺织生产管理 产品结构与生产管理体系 华茂产品.doc
- 分析采样与制样操作 第2章 第1节 样品的采集 第2章 第1节 试样的采集-1.doc
- 分析采样与制样操作 第2章 第2节 试样的采集-2 第2章 第2节 试样的采集-2.doc
- 风味流派 概述 不像川菜的川菜-晾衣白肉.docx
- 风味流派 概述 名俗菜不俗之四川开水白菜.docx
- 服用性能检测 织物耐人造光色牢度测试 教案.docx
最近下载
- 西门子PCS7-CFC培训(工程师培训).pdf VIP
- PCS7工厂分级培训及CFC编程(工程师培训).pptx VIP
- 2025年医学课件-鼻肠管的护理学习.pptx VIP
- AI-Thinker安信可PB-01 PB-02系列模组二次开发指导文档(二次开发指导文档)(3).pdf
- 小鹏汽车技术培训新车型课件.pptx
- 国家基层高血压防治管理指南2025版解读PPT课件.pptx VIP
- 东南大学附属中大医院2026年招聘备考题库及答案详解一套.docx VIP
- 新疆财经大学2020-2021学年《财政学》期末考试试卷(A卷)附标准答案.docx
- 小鹏G9保养手册.pdf
- 新能源小鹏汽车.pptx VIP
原创力文档


文档评论(0)