2.1数据的分析与建模重点.pptVIP

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
2.1数据的分析与建模重点

2.1 数据的分析与建模 建立数据库的过程 数据库究竟是怎样构建的呢? 它的构建需要经历四个基本过程 : 1、数据的收集与分类; 2、建立实体—联系模型(E-R模型); 3、将E-R图转换为关系数据模型; 4、创建数据库。 2.1.1 数据的收集与分类 要想建立数据库,首先要根据具体的应用需求,收集相 关信息,获得原始数据,然后对这些数据进行分析与归纳。 一、数据的收集 数据收集,就是利用外部设备,将时间上或空 间上分散的数据收集起来的过程。 二、数据的分类 对于已经收集好的、建立数据库的各种信息, 我们都是按照数据的基本特征进行分类存放的。通 常的方法是将数据按照人、事、物来进行分类存 放,作为最基本的数据。 2.1.2 数据的抽象描述 数据描述,从客观事物到抽象概念再到计算机的存储方式,实际上涉及三个领域: 问题1:划分三个世界有何意义? 划分三个世界反映了数据管理过程中研究分析数据的 过程与方法。我们总是先看到现实世界的事物,它是客观 存在的,提供的信息是多种多样的,同样的事情不同的人 或在不同情况下提取的信息、看到的特征会不同;然后根 据用户问题的需要对客观世界与问题相关的信息通过文字 符号等把事物本身的特征及事物间的相互联系表达出来, 形成概念模型;再考虑如何把这些概念模型的数据信息以 怎样的结构形式存储在机器上,以便通过机器实现数据管理。概念模型在机器世界中的数据化表示,就是数据模型。 问题2:请把教材中“数据的抽象描述”部分 出现的名词术语找出来? 三个世界的术语对照 2.1.3 概念模型与E-R方法 一、实体集之间的联系 (1)一对一联系(1:1) 实体集A中每个实体至多和B中一个实体有联系,反之亦然。 (2)一对多联系(1:n) 实体集A中每个实体,实体集B中都有n个实体与之联系,反之对于实体集B中每个实体,实体集A中至多有一个实体与之联系。 (3)多对多联系(m:n) 实体集A中每个实体,实体集B中都有n个实体与之联系,反之亦然。 任务4、观察下表实体集间的联系,完成下表。 任务4、观察下表实体集间的联系,完成下表。 二、E-R模型与E-R图 实体-联系模型,也称实体-关系模型,简称E-R模型。是概念模型表示方法中最为著名,最为常用的。 E-R图包括三个图素: (1)实体集:用矩形框表示 (2)属性:用椭圆形表示 (3)实体之间的联系:用菱形框表示 用连线将菱形框分别与有关实体相连,并在上注明联系类型。 问题3:你认为在信息世界阶段,应该从哪几方面 入手分析事物或数据的? 需要从这几方面入手: 1、判别用户的应用涉及到哪几类事物(实体集); 2、这些事物(实体)有何特征(属性), 3、哪些特征(属性)是能够把不同事物个体(实体)区分开来、即唯一标识具体某个事物(实体)的, 4、不同类事物(实体集)间存在什么样的联系。 2.1.4 建立关系模型 一般可以分两步: 1.将每个实体集转换成一个二维表 实体的属性转变成二维表的字段 2.将实体集之间的联系转换成一个二维表 (1)定义一个新的二维表 (2)在一个表中,加入联系的属性以及另一个表中的关键字 * * 第二章 构建关系数据库 任务1:为中小学信息技术大赛设计一张报名 表,研究需要收集哪些数据信息? 经过分析,我们可以将构建“中小学信息技术大赛”数据库需要的数据分为三类: (1)有关参赛选手的信息,如:参赛选手的姓名、性别、学校名称、电子邮箱等; (2)有关参赛作品的信息,如:作品名称、作品类别、作品大小等; (3)有关参赛学校的信息,如:学校名称、地址、联系电话、电子邮箱等。 任务2:报名材料提供了哪些方面的数据信息? 你是怎么进行划分的? 最后,“中小学信息技术大赛”数据库所需的基本数据分为三类: (1)有关参赛选手的信息,如:选手编号、姓名、性别、学校名称、学段、电子邮箱、备注; (2)有关参赛作品的信息,如:作品编号、作品名称、作品类别、作品链接、作品大小、备注; (3)有关参赛学校的信息,如:学校名称、地址、联系电话、电子邮箱、备注。 现实世界 信息世界(概念模型) 机器世界(数据模型) 用户的观点 机器的观点 数据的抽象过程 对象 特征 总体 关系特征 事物及其联系 实体 属性 实体集 键 概念模型 记录 字

文档评论(0)

cc880559 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档