- 1、本文档共14页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代的社保经办 蔡海清 二0一五年五月二十八日 大数据时代的社保经办 一、大数据的概念、特征及类型划分 二、大数据是如何产生的? 三、大数据推动时代变革 四、展望大数据时代的社保经办 大数据时代的社保经办 一、大数据的概念、特征及类型划分 莫衷一是的定义: 麦肯锡报告:“大数据是指大小超出了传统数据库软件工具的抓取、存储、管理和分析能力的数据群” 维基百科(Wikipedia)“大数据是难以用现有的数据库管理工具处理的兼具海量特征和复杂性特征的数据集成” 涂子沛“大小已经超出传统意义上的尺度,一般的软件工具难以捕捉、存储、管理和分析的数据,认为一般应该是“太字节”的数量级” 阿里创始人马云则说,大数据就是一种服务 陈潭认为,不用随机分析法(抽样调查)而采用巨量数据的方法就是当前业界所说的“大数据” 大数据时代的社保经办 一、大数据的概念、特征及类型划分 基本的共识:“大数据”展现出“3v”特征,即:数据体量大(Volume),类型多样化(Variety),处理速度快(Velocity) 数据体量大好理解,就是数据量大。据统计,2013年,世界上存储的数据量达到约1.2泽字节。如果我们做一个比较,就可以大致理解1.2泽字节是个什么概念。一部完整的数字电影可以压缩成1GB的文件,10亿部这样的电影相当于一个艾字节,而1024艾字节才相当于一个泽字节。由此可见,这是一个多么巨大的数据量。为了更形象说明这个概念,我们可以再进行一个类比,如果将这些数据全部印制成书,那么,这些书足以将整个中国覆盖52次之多;如果将之存储在只读光盘上,这些光盘可堆成五垛,且每垛都可伸到384401公里之遥的月球上去。 大数据时代的社保经办 一、大数据的概念、特征及类型划分 第二个特征是类型多样化。直到2000年,数字存储信息仍只占全球数据量的1/4,另外3/4的信息都存储在报纸、胶片、唱片和盒式磁带这类媒介上。7年过去,情况遽然改变,2007年,所有数据中只有7%是存储在报纸、书籍、图片等媒介上的模拟数据,其余全部是各种各样的数字数据。而截至目前,这一比例更是高达98%。 第三个特征是处理速度快。1965年,英特尔(intel)的创始人之一戈登·摩尔(Gordon Moore)在系统考察计算机硬件的发展规律后,得出了一个著名的摩尔定律,即:同一个面积集成电路上可容纳的晶体管数量,一到两年将增加一倍。也就是说,其性能将提升一倍,换句话说,计算机硬件的处理速度和存储能力,一到两年将提升一倍。这一定律经受住了近半个世纪的检验,近50年来,计算机硬件技术的发展速度,甚至比摩尔所设想的还要快。特别是自上世纪90年代起,全世界的物理存储器的处理速度和存储能力,不是一到两年而是每9个月就提升1倍。而云计算技术的广泛运用,更是极大的提高了数据处理的能力和速度。 大数据时代的社保经办 一、大数据的概念、特征及类型划分 由此可见,所谓“大数据”不仅是一个量上的概念,更具有多样性特征,如果不是约定俗成,我个人更倾向于使用“全数据”这样的说法。 “大数据”的定义,我个人比较倾向于使用我国研究大数据的专家所提出的定义,即:大数据是指采用多种数据收集方式,汇集不同数据源,通过采用现代信息技术和架构能够高速分析处理的、具有高度应用价值和决策支持功能的多种类型数据及其技术集成。 大数据时代的社保经办 一、大数据的概念、特征及类型划分 大数据的分类: 从数据类型分:①可以用二维表反映的结构化数据外;?不能以二维表反映的非结构化数据,如音频、视频、图片等;?两者混杂的半结构化数据。 从数据来源分:①行政记录数据;?商业记录数据;?互联网及搜索引擎数据。 行政记录数据包括个人信息记录数据、单位信息记录数据和自然和资源记录数据等;商业记录数据包括电子商务交易数据、企业生产经营数据和信息咨询报告数据等;互联网数据则包括搜索引擎数据、新闻媒体数据和社交平台数据等。 大数据时代的社保经办 二、大数据是如何产生的? 大数据的产生是伴随着计算机技术的迅猛发展之后数据化运动的必然结果。 但要真正理解大数据就必需理解数据和数据化的含义。 大数据时代的社保经办 二、大数据是如何产生的? “数据”(date)一词在拉丁文中是“已知”的意思,也可以理解为“事实”。因此,数据一词不仅仅是指科学实验、检验、统计等所获得的和用于科学研究、技术设计、查证、决策等的数值;也指存储在某种介质上能够识别的物理符号,它代表着对某种事物的描述。 从最宽泛的意义来讲,数据是被记录下来的信息,但信息却未必是数据,只有已经被记录、且可分析和重组的信息才
您可能关注的文档
- 城市的区位选择课程.ppt
- 欧洲内部市场协调局简介课程.ppt
- 欧洲人的东方梦 ——《开辟文明交往的航线》 课程.ppt
- 欧洲早产儿呼吸窘迫综合征防治共识指南(2010版)课程.ppt
- 城市规划管理信息化建设实施方案课程.ppt
- 欧洲主权债危机--启示及中国面临的挑战课程.ppt
- 爬行纲——龟鳖目课程.ppt
- 疱疹病毒(Herpes viruses)课程.ppt
- 疱疹病毒的生物学特性课程.PPT
- 城市轨道交通成本与效益课程.ppt
- CNAS-CL63-2017 司法鉴定-法庭科学机构能力认可准则在声像资料鉴定领域的应用说明.docx
- 12J7-3 河北《内装修-吊顶》.docx
- 12N2 河北省12系列建筑标准设计图集 燃气(油)供热锅炉房工程.docx
- 内蒙古 12S8 排水工程 DBJ03-22-2014.docx
- 山西省 12S10 12系列建筑标准设计 管道支架、吊架.docx
- 16J601-木门窗标准图集.docx
- 12J8 河北省12系列《 楼梯》.docx
- CNAS-GL37 2015 校准和测量能力(CMC)表示指南.docx
- CNAS-RL02-2016 能力验证规则.docx
- 津02SJ601 PVC塑料门窗标准.docx
最近下载
- 2024年广州市高三二模(普通高中毕业班综合测试(二)数学试卷(含官方答案及逐题解析).pdf
- 武汉市2025届高中毕业生四月调研考试(四调)数学试卷(含答案详解).pdf
- (毕业论文)果树采摘机器人的发展现状及运动学分析.doc VIP
- 【高中语文】双新背景下的语文教学设计+85.pptx VIP
- 雨课堂学堂在线《兵棋(中国人民武装警察部队警官学院)》学堂云单元测试考核答案.pdf VIP
- 11.3 一元一次不等式组(教学设计)七年级数学下册(人教版2024).docx
- 年产1万吨一氯甲烷的工艺流程设计.doc
- 医疗器械质量管理制度-全套规章制度.docx VIP
- 木材质量v验收标准.doc
- 直肠癌(外科学课件).ppt VIP
文档评论(0)