- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
大数据时代下计算机信息处理技术探析
大数据时代下计算机信息处理技术探析
吴斌
北京中电普华信息技术有限公司
X
关注成功!
加关注后您将方便地在 我的关注中得到本文献的被引频次变化的通知!
新浪微博
腾讯微博
人人网
开心网
豆瓣网
网易微博
摘????要:
大数据时代实质上指的是信息时代, 因为大数据的大内涵指向为计算, 数据则是指信息, 也就是说, 大数据从本质上来说就是一种关于信息的处理技术, 其以计算为主要特征。同时, 在大数据时代的背景之下需要理解大数据与云计算之间的关联性。因为在数据积累越来越多、处理需求越来越高的情况之下, 只有依靠更为精密的计算器才能解决数据积累库存的问题。本文就以此为前提具体分析大数据时代背景下的计算机信息处理技术。
关键词:
大数据; 计算机; 信息处理技术;
收稿日期:2017-8-26
Received: 2017-8-26
当前, 人类的认识已确定了以“关系”作为解释万事万物的基本事实, 并且认为在人类社会中, 只有有效处理人与人、人与物之间的信息交流问题, 令其实现快速化、精准化的对接才能较好促进人类社会的演进与发展。因此, 在这种较为进步的理念基础上, 目前的计算机信息处理技术应作为工具、方法、意图而为人类走出困境及可持续发展发挥更大的作用。
1 大数据特征及影响
大数据的特征主要体现在三大方面, 分别是数据量、存储空间、处理速度。因而在计算机处理信息时, 需要鉴别区分数据种类, 如区分文字、图片、视频、网页格局此类信息就有助于提高处理的便利性。根据现有社会结构中起作用的企业集团观察, 大数据的影响主要是令原来的制造生产“6+1”产业链转变为“4+1”。比如, 传统的制造业生产中要求根据产品设计、原料运输、生产加工、订单处理、市场营销、零售六大环节进行按部就班地生产制造, 而运用大数据之后就可以较好打破这种产业链的“程序”, 从而实现重新排列组合。比如, 当建立大数据平台之后, 就可以较好利用数据信息, 网络平台首先以“订单处理”作为主要切入口, 然后压缩其中的环节, 提高生产效率, 实现零库存, 最终实现订单处理、生产设计、原料运输、生产加工的新型产业链闭环。也就是说, 通过运用大数据方法, 能够有效按照信息采集、数据分析、文字表述等步骤, 较好实现以消费者为主导的制造生产计划, 令市场经济环境下的企业运作更具有计划性、可控制性, 既有利于资源的合理配置, 也能够为企业的发展提供理性规划选择。
2“大数据”时代背景下的计算机信息处理技术
2.1 DEEPWEB (不可见网) 数据感知与获得技术
不可见网技术是对网络深层空间利用的技术, 它的数据量具备信息动态, 分布性、访问方式特殊和信息海量等特征。不可见网技术能够合理运用其数据展开高品质的数据集成, 从而对数据进行再收取与整合。
2.2 分布式数据储存
Google公司率先实现了可扩展的分布式文件系统技术[3]。这项技术被广泛的应用在万国商业机器公司、百度等企业中, 并且还在迅速的发展中。分布式储存运用了列储存的方法, 也就是说, 将列作为单位展开储存, 和行储存相比较, 其拥有快速循环、数据压缩等优势。现如比较今时兴行列混合式存储结构的技术, 可以迅速加载规模庞大的数据, 将查询时间尽可能的缩减到最少, 有效的运用磁盘空间。在研究过程中, 可以结合更好的方法完善数据布局分布的储存方法, 增强大数据的储存和处理速度。
2.3 数据有效索引
目前主要是研究互补式聚簇索引与聚簇索引。互补式聚簇索引运用多副本作为索引列建立相互补充的索引表, 而同时依据索引顺序储存所有的数据是聚簇索引的特点。结合查询结果估算办法, 最后进行查询最优数据的计划。
2.4 在内容信息的基础上的数据开发
在内容信息的基础上的数据开发主要是对网络搜索技术和实体关联的探究。现在web信息搜索主要是排序学习算法, 它的提出是基于社会媒体的信息量, 以社会媒体的关注数据的特点作为短文本的特征, 通常有逐点, 逐对以及逐列这几种主要的排序学习算法。
2.5 神经网络与遗传算法
神经网络的提出是源自于生物神经网络结构和运作的启发。神经网络算法主要通过模仿动物运动神经的网络行为, 开展分布式并行信息处理的一种算法。遗传算法的提出也是基于借鉴生物界的演化规律转变的任意性搜索方法, 其寻优方法使用概率化, 可以自行改变搜索方向, 被广泛运用于信息处理等多个方面。
2.6 分类分析与聚类分析
分类分析与聚类分析基本上是运用在数据开发上, 通过对数据展开归类, 之后再明确新的数据点, 在确定假设与客观结构的条件下, 预测客户行为;或是在不清楚限制因素的条件下, 把几何分割成多个对象组, 再针对对象组展开分析。
2.7 分析数据技术
囊括了网络分析、回归分析、时域序列分析、空间分析以及感情分
文档评论(0)