大数据使用边界和安全调用模型浅析.docVIP

大数据使用边界和安全调用模型浅析.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据使用边界和安全调用模型浅析 丁大勇张琳 北京师范大学经济与工商管理学院中国科学院心理 摘要: 随着大数据产业的发展,大数据的跨平台使用和调用愈加频繁。以用户全量为特 征的大数据具有高度精准和信息量大的特点,为了确保用户隐私、数据源提供商 商业信息安全,我们需耍对大数据使用的边界进行明确定义。通过对大数据模型 构建和使用目的的分类分析,我们可以定义出大数据使用的边界并通过使用边 界构建出安全调用模型。在明确的使用边界和安全调用模型基础上,大数据数据 源提供方和调用方可以有效确保信息安全,避免大数据调用屮可能存在的各种 风险。 关键词: 大数据;数据安全;使用边界;调用模型;隐私保护; 作者简介:丁大勇(1982, 9—),男,汉族,四川荣县人,北京师范大学经济 与工商管理学院工商管理硕士在读,研宄方向:企业管理。 大数据数据安全问题己经成为一把悬在大数据行业头上的达摩克利斯之剑,对 大数据调用边界定义和安全调用规范的制定已经刻不容缓。京东微联、平为与腾 讯就微信数据分享问题爆发激烈冲突等事件己经充分证明在大数据层面如果数 据源供应方和使用方等多方层面没有协调好,对普通大众而言容易陷入城门失 火殃及池鱼的境地。 viz/:据分析特点和大数据来源解析 viz/ :据分析特点和大数据来源解析 1.1数据分析特点和分类维度 数据分析指通过呈现的数据进行综合、整理和分类的研究方式并根据数据研究的 目标在呈现的数据中进行问题的求解最终得到问题答案的过程。 数据分析可以从点、线和面三个维度来进行分类。 从一个点的维度来看,数据分析指的是对特定对象而言的生命周期内的全 量数据,主要展现的是特定对象的所有指标的全量参数值。从这个维度来看,如 起居注这样的历史记录则是对特定帝王以时间为轴的数据记录。当记录的内容够 多够详实则形成了对这个对象的生命周期内的数据记录表,通过对点状数据表 的连续观察可以得到单个对象的生命周期演进和发展图景。 从一条线的维度来看,数据分析指的是同时段内发生的多个对象的全量数 据集合。对线状数据的研宄方式更多采用统计学理论进行交叉关联数据的对比、 相关性分析等,得到的是某个特定个体在群组中的位置、深度等分布位置性的判 断,在应用侧通常采用传统的数据库方式进行字段整理、目标特征字段抽取和数 据算法的编制。 从一个面的维度来看,将各类线状数据放在同一个面则会呈现出交集点多, 关联性弱,冗余和噪音数据量巨大并且难以用在线状数据模型中常规的统计、分 类和归纳等作业方式进行有效处理的数据集。 1.2大数据数据产生原因和分类方式 人类进入电子化吋代以来,将多个线状数据归到一起难以灵活处理的问题 一直存在,以往的解决方式是通过线状数据间的可关联点进行交集后,通过关 联点进行处理而将非关联点数据作为无用数据和噪音数据丢弃。但随着计算机处 理能力、存储能力和网络交互能力的提升,尤其是进入云计算时代后,曾经困扰 大数据处理的硬件瓶颈被突破,在技术和业务层获得了对以面状结构为代表的 大数据的处理能力。 与传统的数据处理A标不同,大数据模型下对数据的处理主要为相关性分析、动 态最优模型以及趋势预判,涉及到基础数据统计分析技术、机器学习和算法、人 工智能建模以及预测模型等技术。 大数据的数据源按不同的分类标准有多种分类的结果,最基础的分类为自 然数据源和人工数据源两大类。自然数据源指不以人类意志为转移的自然存在并 持续产生的数据,如某个时点某个具体个体所在位置的气温、地势、单位光照量 等。人工数据源指由人类生产活动产生的数据,如某个具体个体在某一个吋点产 生的网络浏览数据、位置经纬度数据等。传统的数据分析偏重于数据源层面,很 少将两者结合起来进行关联分析,而在大数据模式下,将这些看似不关联的数 据整合在一起进行全量分析可以从中找到曾经忽略的关联,而这些关联所带来 的最优结果模型可以进一步得到趋势判断等S经无法得到的结果,从而使大数 据技术的作用和价值得到呈现。因为对数据来源的分类标准不一,大数据来源也 有线上和线下、虚拟和实景等不一样的分类内容。 在物联网体系内,按照大数据源产生的主体大数据源可分为机器大数据和 人工大数据两块。机器大数据主要产生于物联网体系内由万物互联的各种设备产 生的设备运行和状态数据为主,而人工大数据则跟设备服务对象的行为相关。对 大数据的类别、性质和属性的定义与人数据分析的目的和建模求解结果需求相关, 二者的界限比较模糊,很多场景下不具备严格区分的能力。如车联网系统中的行 车轨迹、瞬时油耗等数据,可以被看作是机器数据源对汽车自身状态进行分析的 同时也可以关联到汽车的驾驶员的行为作为数据分析的数据源。同样地,在对电 商用户行为的大数据分析模型中,用户在电商平台的浏览、互动和购买等线上动 作一般是主要的大数据数据源,而电商

文档评论(0)

ggkkppp + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档