Big Data 技术综述及参考架构.pdfVIP

  1. 1、本文档共43页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
Big Data 技术综述技术综述 及参考架构及参考架构 lch@ TSD 2012年5月31 日 此处填写密级标识 行业背景与发展趋势 此处填写密级标识 背景背景-什么是海量数据什么是海量数据 DefinitionDefinition “大数据是指无法在大数据是指无法在一定时间内用常定时间内用常 规软件工具对其内容进行抓取、管理 定义 和处理的数据集合” ——维基百科 Big Data Feature Volume :数量大 海量数据海量数据 VelocityVelocity ::时效性要求高时效性要求高 特征 Variety :种类和来源多样化 application 搜索引擎网页处理 用户行为分析 应用应用 商业智能(BI) 此处填写密级标识 行业背景行业背景 此处填写密级标识 行业解决方案 此处填写密级标识 重要需求 此处填写密级标识 物联网信息中心物联网信息中心-移动互联网移动互联网 • 场景场景:物联网信息中心物联网信息中心 批量数据的查询、实时 分析、友好展现 • 数据规模:物联网采集 终端实时在线,月产生 数据在200TB左右 • 查询响应时间,能够秒 级返回结果,对于最复 杂的查询须在杂的查询须在55分钟分钟以以 内返回结果 • 海量数据的实时分析, 友好的用户界面友好的用户界面 • 硬件配置,X86,8G内 存,PC Server 此处填写密级标识 电信详单账单查询系统电信详单账单查询系统-电信电信 场景描述: 电信行业通常需要为用户提供电信行业通常需要为用户提供6到到12个月的详细话单和账单的查询个月的详细话单和账单的查询。 原有方案: 现在的系统是把这些数据全部存储在生产数据库的现在的系统是把这些数据全部存储在生产数据库的OOraclle数据库中数据库中, 占用生产数据库的大量存储空间,增加了生产数据库的存储和访问压力, 而且生产数据库存储的数据月份有限制。 新方案: 新的系统将采用独立的分布式文件系统和分布式数据库来存储往月的详单 和账单和账单,提供数据的压缩存储提供数据的压缩存储、备份备份、多种指标的查询多种指标的查询、汇总统计等功能汇总统计等功能, 满足日益增长的数据处理需要。 性能指标: 数据记录数 存储容量 查询响应时间(s) 1212个月个月X30X30亿亿//月月 1212个月个月 XX 1T/1T/月月 XX 复制因子复制因子33 1ss 此处填写密级标识 硬件环境: HP DL360 G7 6台 熙康健康社区熙康健康社区-社会化网络应用社会化网络应用 场景描述: 熙康服务社区用户产生海量数据包括评论、照片等,社区健康顾问可以 通过健康传传感器采集到的健康指标信息推荐各种健康内容 性能指标:

文档评论(0)

celkhn5460 + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档