- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
;一、大数据的背景;;三权组织机构;约翰·摩斯——《信息自由法》
(担任美国国会议员25年,六朝元老、连选连任)
1955年摩斯着手信息自由的立法工作以来,一系列列的法律层层叠加,不断完善,美国的信息自由最终形成了一个体系,这个体系也成了世界上许多国家制定《信息自由法》的模板,截止2006年,已有60多个国家实施了类似的法案。;奥巴马政府;信息的自由、公开;数据帝国;数据的储存单位;2009年美国各行业数据存储量(拍字节);庞大的数据资产需要经费来支持,联邦政府1996年度IT预算180亿美元,2011年已经高达784亿美元。
这些投资中的一半以上,都用在了购买存储数据的硬件设备上。
这是一个不择不扣的数据帝国。
帝国形成的原因——摩尔定律。
戈登.摩尔(Intel的创始人之一)
其内容为:当价格不变时,集成电路上可容纳的晶体管数目,约每隔18个月便会增加一倍,性能也将提升一倍。换言之,每一美元所能买到的电脑性能,将每隔18个月翻两倍以上。这一定律揭示了信息技术进步的速度。;最小数据集Minimum Data Set;源于:医疗领域
出院病人最小数据集
病人都要付钱——医疗账单最小数据集
出台统一的数据格式——医疗保险和索赔最小数据集
在医疗领域迅速被推广,几乎每年都有新的最小数据集被定义。
眼科,眼科,皮肤科等等医疗服务的方方面面各种各样,特定的最小数据集;传感器;政府的三种数据源;政府应对数据爆炸颁布的法案:
《信息自由法》可以公开数据
《阳光政府法》必须公开数据
《电子信息自由法》计算机数据公开
数据源——大数据
大小超出传统意义上的尺度,一般的
软件工具已经难以捕捉、存储、管理
和分析的数据。 没有统一的定义。
大数据的特点:大知识、大科学、大利润、大发展。
;每一个机构和部门都要制定一个应对大数据的战略;二、数据开放平台Data.gov;Data.gov上线同一天,美国阳光基金会宣布设立
25000美元的奖金,举办程序员公共数据开放大赛。
参赛作品必须使用Data.gov开放的数据,可以是数
据的分析程序,可以是数据可视化的应用,还可以是社交
网站和智能手机的查件。
Data.Gov初次上线只开放了47组数据,但三个月内,阳光
基金会却收到了47个新的开发应用程序。
大量的“互动”使Data.gov的功能不断完善,先后加入了
数据的分级评定、高级搜索、用户交流以及和社交网站互动
等等???的功能。
2009年12月8日《开放政府的指令》命令各个联邦部门必须
在45天之内,在Data.gov上至少开放3项高价值数据。;(上线的第一天受到了210万的点击,两个月创下了2000多万次的访问总量。);DATA AND TOOLS;候机经济学:航班延误分析系统 FlyOnTime.us;数据混搭器
DataMasher;Data.Gov成果;三、业界发展动态; 商务智能指利用数据仓库、数据挖掘技术对客户数
据进行系统地储存和管理,并通过各种数据统计分析
工具对客户数据进行分析,提供各种分析报告,如客
户价值评价、客户满意度评价、服务质量评价、营销
效果评价、未来市场需求等,为企业的各种经营活动
提供决策信息。;数据仓库 Data Warehouse; 数据仓库是商务智能的依托,是对海量数据库进行分析的核心物理构架,是
一种格式一致的多源数据存储中心。数据源可以来自多个不同的系统,如企业内
部的财务系统、客户管理系统、人力资源系统,甚至是企业外部系统。
数据仓库的物理结构出现以后,一系列的产业链也逐步形成:
ETL Extraction Transformation Load
ETL就是将数据按统一的格式提取出来,然后再转化,集成,载入数据仓库
的工具 。
联机分析
Online Analytical Processing
联机分析也称多维分析,本意是把分立的数据库“相联”,进行多维的分析。
“维”是联机分析的核心概念,指的是人们观察事物、计算数据的特定角度。
可以从任意的维度交叉和细分问题,用户能根据自己的需要,随时创建“万维”
动态报表。
;数据挖掘Data Mining;数据可视化Data Visualization;X1=X2=X3, X4=8
X1,X2,X3和X4的平均值等于9,其方差等于10,Y1,Y2,Y3和Y4的平均值等于7.50,其方差等于3.75
4组数据都符合线性回归:y=3+0.5x
也就是说:4组数据中,X和Y之间的关系是相同的。个别数据偏离可以视为随机产生的干扰。
;大趋势数据开放的舰队已经形成;云计算——新的航向;;大数据时代;四、底层技术简介;Hadoop;Hadoop特性;机器学习技术;研究领域;人工神经网络(ANN);基于JAVA的开
您可能关注的文档
最近下载
- 车尔尼钢琴初步教程 作品599 教学与弹琴指导_12198815.pdf VIP
- 安全生产月竞赛题库(附参考答案).pptx VIP
- 2025年上海市绿化和市容管理局部分直属事业单位公开招聘笔试历年典型考题(历年真题考点)解题思路附带答案详解(5套).docx
- Unit 4 My friends Friends share第2课时冀教版(三起)(2024)英语三年级上册.pptx VIP
- 起风了sax五线谱.pdf VIP
- 影视话剧剧本_性情男女.docx
- 湘少版三年级上册英语全册教学课件.pptx
- 蚁群算法.ppt VIP
- 江苏开放大学《宏微观经济学》——计分作业2 .doc VIP
- 民族团结铸牢中华民族共同体意识PPT (3).pptx VIP
文档评论(0)