基于海量网络数据可视化服务平台研究.docVIP

基于海量网络数据可视化服务平台研究.doc

  1. 1、本文档共6页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于海量网络数据可视化服务平台研究

基于海量网络数据可视化服务平台研究   摘要:为了保证网络以最优状态运行,更好承载各种应用服务,需要对网络实时运行情况进行可视化的监控,以定位发现性能问题的根源。基于海量网络数据的可视化服务平台,利用云计算强大的储存和计算能力,基于SaaS 模式服务,完成海量数据的挖掘和综合分析,以企业为主体、以市场为导向、产学研结合,是互联网时代,以高新科技实现节能减排、能源合理利用的创新,充分实现了“资源共享、低投入、低消耗、低排放和高效率”,提供构建各种大型企业网络的数据挖掘应用常用的功能,值得大力发展和推广。   关键词:海量网络数据;可视化;服务平台   中图分类号:O157.5 文献标识码:A 文章编号:1007-9599 (2012) 11-0000-02   一、研究的意义   过去的企业信息化建设往往要购买服务器、存储和网络设备等,而对于中小企业来说,花重金购建这些高端设备,实在是有些力不从心,是企业发展的一大负担,中小企业信息化建设因此滞后。而基于互联网的服务交付式软件的出现,使得企业进行信息化建设的费用大大降低,企业无需再购买繁杂的IT设备,就可以实现信息化管理。按照构建“数字珠江三角洲”的总体要求,突破区划、部门、行业界限和体制性障碍,加大信息基础设施建设力度,加快部署新一代通信网络,分区域、按步骤推进无线宽带城市群建设,构建“随时随地随需”的珠江三角洲信息网络。“基于海量网络数据的可视化服务平台”这一SaaS模式的基于互联网的服务交付软件的出现,符合市场发展的需要,也符合未来发展的方向。   海量数据处理必须要使用大型分布式计算模式,即云计算技术,这种技术利用高速互联网的传输能力,将数据的处理过程从个人计算机或服务器移到互联网上的计算机集群中,通过互联网向外部客户依需求提供抽象、虚拟、动态、可管理的计算能力、储存空间、平台和服务。据IDC(国际数据公司)预测,用于云计算服务上的支出在接下来的5 年间可能会出现3 倍的增长,占据IT支出增长总量中25%的份额。随着信息化社会的发展,目前企业的各种业务系统中数据从GB、TB到PB量级呈海量急速增长,相应的存储方式??从单机存储转变为网络存储。传统的信息处理技术和手段,如数据库技术往往只能单纯实现数据的录入、查询、统计等较低层次的功能,无法充分利用和及时更新海量数据,更难以进行综合研究、分析和为领导部门提供决策支持,不能满足人们对这些资源调查、开发、利用和科学管理的需要。“数据海量,信息缺乏”已经是大多数企业所面对的尴尬,人们不得不考虑采用新的方法和技术,使之能够智能地、自动地或半自动地将这些数据转化处理为有用的信息和知识。云计算的重要特点之一就是适合完成面向海量数据和复杂计算过程的计算任务。并且此技术通过互联网应用,因此,“基于海量网络数据的可视化服务平台”将有效利用云计算强大的储存和计算能力,和互联网的便利性提供SaaS 模式服务,通过网络进行海量数据的挖掘和综合分析。   二、研究内容   (一)研究企业级数据挖掘基础平台   本项目研究的企业级数据挖掘基础平台,提供构建各种大型企业网络(一般IP网络,GPRS数据网络、CDMA数据网络、宽带网络)的数据挖掘应用常用的功能:方案管理、样本管理、算法库管理、模型库管理、知识库管理、智能控制、任务调度、信息发布、日志管理等。同时支持数据挖掘流程所需的主要过程,完成包括对数据进行预处理,包括空值处理、降维处理、离散处理,主成分分析、抽样、过滤等,创建、训练、评估模型,预测,修改模型参数,误差分析等一系列功能。支持分类与回归、聚类分析、时间模式、关联规则、偏差检测等各类数据挖掘应用。同时提供构建常用数据挖掘业务模型的常用算法,如:特征提取、属性选择、离散化、BP 神经网络、RBF神经网络、灰色系统、决策树、决策表、贝叶斯、懒惰算法、支持向量机、K均值聚类、Apriori 关联规则、HotSpot 关联规则、回归分析、指数平滑、季节移动平均及组合算法,运用这些算法模型可实现分类与回归、聚类分析、时序模式、关联规则、偏差检测等各类数据挖掘应用,而且平台在挖掘功能、挖掘算法、挖掘建模等方面具有较强的扩展性。   (二)研究基于Web Services服务接口和SOA架构   由于数据挖掘过程与挖掘工具的紧密结合影响了数据挖掘技术的广泛使用,需要一种体系架构可以实现服务提供者与服务消费者之间的松散耦合的特点。平台通过Web Services 方式为用户提供数据挖掘服务,从而大大降低数据挖掘的使用难度,采用SOA 架构以一种耦合度极低的方式实现数据挖掘与第三方软件有效集成。实现了服务消费者动态绑定不同的服务提供者,从而实现了在数据挖掘应用中数据挖掘服务的整合。   (三)研究面向网络用户的海量数据可视化服务平台   针对单机服务器所

文档评论(0)

317960162 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档