- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大学计算机__计算思维导论;第五章 数据抽象、设计与挖掘;关注一些信息;数据处理的一般性思维;数据处理的一般性思维;数据处理的一般性思维;5.1 数据与大数据;大数据(一个当前时髦的概念!)
21世纪随着互联网技术的发展,促进了互联网数据的膨胀式发展,网络世界中面向人-人互动、人-机互动等声音、图像/视频、文档大规模数据的聚集与交换,形成了所谓的“大数据(Big Data)”。
物联网技术进一步使实物商品、实物资源等被感知、被联网,形成大规模的物联网数据。 ;;大数据的价值发现
大数据时代最大的转变就是,放弃对因果关系的渴求,而取而代之关注相关关系。也就是说只要知道“是什么”,而不需要知道“为什么”。
体现“数据价值”的示例:
华尔街金融家利用电脑程序分析全球3.4亿微博账户的留言,根据民众情绪抛售股票:
银行根据求职网站的岗位数量,推断就业率;
投资机构搜集并分析上市企业声明,从中寻找破产的蛛丝马迹;
美国总统奥巴马的竞选团队依据选民的微博,实时分析选民对总统竞选人的喜好,基于数据对竞选议题的把握,成功赢得总统大选。
中国网民发动的“人肉搜索”,已成功地使若干“表哥”“表叔”“房叔”“房妹”等腐败官员落入法网。
……;数据被视为知识的来源、被认为是一种财富,数据收集、数据管理、数据分析的能力常常被视为核心的竞争力,和企业利益息息相关。;问题2:如何管理数据?
;
问题2-1:日常生活中,你如何管理你的“数据”?
;整理、找地方存放、记在脑子里、放在文件夹里、放在柜子里
目标是:容易找到
区分、归类、命名、统一表达、存储、查找、分析;;5.2数据聚集的核心:数据管理与数据库;数据是怎样被管理的呢?
通常将各类数据组织成一张张表格(如下图)来进行管理。
随着计算机技术的发展,这种数据管理工作被发展成一种技术,即“数据库”技术。
所谓数据库(DataBase, DB),即可看作是以“表”形式组织起来的相互有关联关系的数据的集合。而管理数据库的一种计算系统被称为数据库管理系统(DataBase Management System, DBMS)。 ;问:有无一般性的数据表达和处理方式?;数据库管理系统(DBMS) 管理数据库的基本思路/步骤;数据库管理系统(DBMS) 管理数据库的基本思路/步骤
(1)定义表的格式:DBMS提供数据定义语言(Data Definition Language, DDL)来让用户表达他要定义什么样的表,然后DBMS会按照用户的需求在系统里面建立相应的表。
(2)按格式操纵表中数据:DBMS提供数据操纵语言(Data Manipulation Language,DML)来供用户表达他想对数据库所进行的操作,并获取相应结果。
(3)对表的使用进行控制:DBMS也是通过提供一种数据控制语言(Data Control Language,DCL)给数据库管理者,以方便其表达对数据库的安全性控制需求。然后DBMS按照管理者定义的安全性,对访问数据库的用户和程序进行控制。 ;定义数据表;定义数据表
列(Column):也称字段(Field)、属性(Attribute)。表的每列都包含同一类型的信息,列由列名和列值两部分构成。
行(Row):也称元组(Tuple)或记录(Record)。表中每一行由若干个字段值组成,描述一个对象的信息。
表(Table):也称关系(Relation),由表名、列名及若干行数据组成。在数据库领域,这种简单结构的二维表又被称为“关系”,以表这种形式反映数据组织结构的模型被称为“关系模型”。
关系模式:在表中,表的结构(或格式)被称为关系模式,主要由表名和列名构成。
;定义数据表
码:在表的各种属性中,有一个属性或属性组很重要,那就是码。(Key)也称为键,或者关键字,它是表中的某个属性或某些属性的组合,它们的值能唯一地将该表中的每一行区分开来。
数据库:一个表用于描述客观世界中的一件事情,对不同事情的描述则用不同结构的表,如此若干数据表的集合便形成了一个“数据库”。
数据表的性质:
列是同质的;
列的顺序可以任意交换;行的顺序可以任意交换;
任意两个元组不能完全相同;
4) 表中每一数据项必须是不可再分割的数据项,即都应是按行按列管理的简单的二维表,满足此性质的表称为规范化的表或规范化的关系。 ;至此,我们得到了初步的模型
为了得到一般性的理论,需要对模型的性质进行研究;数据表的性质:规范化的表或规范化的关系。 ;我们说:
(1)关系/表之间是可以相互操作的,而对关系/表的操作结果仍然是关系/表。
(2)有5种基本的关系操作是必须的,即数据库管理系统至少应支持:“并”、“差”、“笛卡儿积”、“选择”和“投影”等操作。
(3)数据库管理系统还应支持用户通过这5种基本操作的组合来
您可能关注的文档
最近下载
- 力帆 2019款 KP350 摩托车适用2019款2020款 用户说明书 保养手册.pdf
- 2025-2031年中国COSPLAY服装行业市场全景评估及投资战略研究报告.docx
- 解数咨询-全价猫主粮行业调研报告:醇粹、高爷家.docx VIP
- 剑桥少儿英语二级下册unit2.ppt VIP
- VSD负压引流术护理查房.pptx VIP
- 大众奥迪诊断系统ODIS7.21用户手册.pdf VIP
- 《混合动力电动汽车》课件.ppt VIP
- 网神日志审计系统技术白皮书.doc VIP
- 高级英语第一册-U10-The-Artist-in-America.ppt VIP
- 狗主粮行业调研报告解数咨询14117mb.pptx VIP
文档评论(0)