企业数据也可以循环利用..doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
企业数据也可以循环利用.

企业数据也可以循环利用   众所周知,数据只有流动起来才能产生价值……企业的数据可以总结为两个方面,第一个方面被称之为“企业内循环”,主要涉及到所从事的工作有助于加速企业提高经营效率,完成开源节流;另一方面叫做“企业外循环”,可以理解为通过企业产品让用户形成互动,进而产生海量数据。“如果将整个企业的外循环与内循环有机结合起来,就形成了企业的数据循环的一个体系。”红象云腾创始人童小军对《中国信息化周报》记者表示 循环、优化、流转一气呵成 具体来说,对于数据分析的基本理念可以理解为“循环、优化、流转”,这是来自对于数据统计分析的一个理解。童小军说:“我觉得一个企业可以被看作一个生命体,具有自调整能力,将下层的产品统计、运维测试等统筹起来实现了一个在测的内循环,这是来自互联网公司的内循环。在外部,我们的产品与用户形成了企业的外循环。例如如果要优化产品,我们会记录用户数、活跃度等,这些数据会源源不断地更新到我们的产品中,或者我们的系统如果给一个用户发出一个搜索引擎或者一个需求,这时候企业给他们一个适时推荐,这个也可以称之为外循环。” 同样类似的案例在企业的质量管理中也存在,例如我们经常提到的戴明环等,其中也提到了循环质量优化的观点;还有一个自动控制领域也涉及到闭环控制理论 在我们的理解中,其实大数据所起到的作用在反馈这个层面,只有整个的大数据体系形成闭环的模式才能更好地服务企业 “我们所理解的智能应该是一种结构,很简单地被认为是一种闭环的反馈结构,而这种结构本身具备了一系列的制度。我们企业数据循环系统可以释放整个数据的想象力,关键大数据系统要打开关于数据的释放响应空间。其中数据循环、持续优化,高速流转,系统稳定、开源开放等都是客户所提出的需求。”童小军补充道 如今大家经常提起大数据Hadoop,分别涉及到化整为零、分片存储、移动计算、分片处理。因为分片存储以及化整为零的技术,每台机器都可以用,这样就形成了移动计算分块处理。因为数据分散的动能,就可以将其移动到机器的本地化处理,所以整个系统会表现得非常高效 另外本地化处理与并行可以极大地解决IO问题,带宽问题以及计算问题,在集中式机构时就会面临这样的问题。因为作为集中式架构根本性的一个性能缺陷在于无法移动计算,就需要把数据从集中式的存储拖拽到拥有计算的资源中进行再次计算,从而产生了一个IO瓶颈、带宽瓶颈以及磁盘瓶颈等 童小军在分析大数据Hadoop时说:“通过对分布式计算的移动计算、化整为零等体系的全面了解,逐渐形成了一整套基于开源的系统,这是我们以前基于gedis架构的系统。我们可以看到Hadoop生态圈就像原始森林一样,从底层的Hadoop等出发,我们可以把它总结成几个层面 首先是平台层,其次是结构层、计算层、展现层以及管理层。其实开源大数据到底是大数据推动了Hadoop发展,还是Hadoop推动了大数据发展并没有一致的绝对性,其中都是互相推动的过程。我们可以看到整个Hadoop生态圈已经庞大,其实开源本身也产生了标准的力量,对大数据标准产生带来了助力。” 极致性能 生态化才是王牌 商务方面,红象云腾提出了生态化的战略,其中+Hadoop是公司提出的观点,目标是服务更多的集成商,成为生态一部分。以“+Hadoop”为核心形成整个生态圈,进而达到服务器、各种中间键以及相应的多角度、全方位服务 在大数据领域,通过软硬件一体化,企业更需要打造极致的性能,红象云腾在这方面有很多合作伙伴,第一个是红旗,另一个是中太服务器,组成了红色数据高铁的红象。“这个项目我们完成了将近几万亿数据的快速检索,当然这里还有其他的核心作用,我们叫做china Redoop,红象的超级数据,形成了整个优化的产品站、128线程,红象云腾今后的目标是对更多的CPU进行更进一步的加速,进而形成打造极致的性能。”童小军展望生态化战略时表示 企业通过与硬件厂商的合作,可以提炼成一个库,叫做Hadoop处理加速库,同时加速库也可以提炼为一个观点,叫做HPU 其关键的作用主要是实现在Hadoop框架下多种项目的加速,例如EC、SORT等都可以通过这个方式来完成加速。其中涉及几个性能指标,通过与Java、X86、IBM相比,提速将近有30倍以上 童小军认为在加速库的角度,红象云腾早已进行了极致的分析,目前通过全面合作的策略,已与两款国内的大数据软件,分别是YDB和kylin完成合作,哪怕是在kylin检索上千亿数据也是可以完成的。这个打破了Hadoop在高速检索速度慢的怪圈,原因在于这其中所有的数据库并不是直接拷贝到硬盘上 应用案例 不胜枚举 说到数据循环的成功案例,也是不胜枚举。例如,联想电商,这套系统其实非常符合数据循环系统的理念。在联想主要包含两套

文档评论(0)

linsspace + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档