微软大数据最重要是洞察力.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
微软大数据最重要是洞察力

微软大数据最重要是洞察力   从处理到分析 :雅虎TAO之大数据进化   雅虎公司总部位于加利福尼亚,其搜索引擎、门户网站、新闻推送等网站每月独立访问者超过700万人。 为帮助广告客户更好地分析消费者相关的数据并成功地吸引客户,雅虎构建了定位、分析和优化(简称TAO)解决方案。作为一个功能强大、可扩展的广告分析工具,TAO基于雅虎网站,通过Right Media Exchange为成千上万在雅虎网站上投放广告的客户提供报表。   TAO平台的一个组成部分是开源软件框架Apache Hadoop,Hadoop曾是公司广告分析中大数据管理的主要工具。每天Hadoop处理超过3.5亿次的广告显示,以每小时进行刷新。TAO的源集群每个季度处理着4640亿行的数据。 尽管如此,该公司依然需要寻求新的、性能更高的、能够与Hadoop协同工作的商业智能解决方案,从大数据当中提取更多更有意义的分析信息,快速地对客户需求做出响应。   后来,雅虎利用微软SQL Server 2008 R2企业版数据管理软件,创建了一个新的BI解决方案。雅虎增强了其TAO基础架构,现在能够从一个Hadoop集群当中抽取数据并加载到一个第三方的数据库当中,并最终把数据加载到一个SQL Server 2008 R2分析服务的多维数据集当中。多维数据集支持来自客户端,如Tableau Desktop业务分析软件、内部自定义的应用程序等工具的连接。员工可以使用这一软件来创建交互式的数据仪表板并实现热点分析。微软已经开发出了针对Apache Hadoop的SQL Server连接器,实现在Hadoop和SQL Server 2008 R2之间的高效数据传输。目前,对于雅虎TAO用户而言,从Tableau Desktop客户端提交的查询结果返回的平均时间为6秒,而从公司定制的优化的应用程序提交的查询结果返回的平均时间为2秒。   “在电子商务顾客网上行为分析、智能交通摄像头数据的提取分析、基于天气交通的物流优化等方面,大数据有着非常现实的需求。”近日,微软(中国)SQL Server高级产品市场经理郝雪莹到中国计算机报社就大数据做培训交流,介绍了微软眼中的大数据。   大数据≠Hadoop   不论大数据的特征到底是3V还是4V,因为有了互联网,有了社交化,有了云……企业的运营环境正发生巨大的改变。企业许多业务都需要捕获??量空前的数据,这些数据中包括大量的结构化和非结构化数据,为企业带来收益的同时,也给企业的数据收集、存储、处理提出了严峻的挑战,郝雪莹说。   在无需承担构建复杂的分布式存储和计算集群的情况下,企业需要有效处理结构化和非结构化数据,以有效方式将内部和外部的数据及服务结合,从包括社交媒体在内的更多来源中挖掘、分析数据,并及时做出决策,并以用户熟悉的方式进行分析和展现。   郝雪莹介绍,不能将大数据与Hadoop完全划等号。它只是实现大数据数据管理的一种工具,可以使用普通机器实现分布式处理复杂计算和数据,真正把数据用起来,还需要很多其它工具和平台的支持。   在微软看来,大数据不是一种具体产品,而需要从数据全生命周期角度考虑, 它包含数据管理、数据丰富和数据洞察三个层面。数据管理,即如何获取、存储和保护数据;数据丰富,微软在Windows Azure的数据集市上为用户准备了丰富的选择,将第三方解决方案提供商、服务提供商或者是模块提供商和最终的商业用户的数据和应用联合在一起;数据洞察力,即通过分析、呈现与决策工具,获得洞察力,产生价值。微软现有的商业智能(BI)平台与协同、呈现工具的无缝结合,可以将大数据更好的可视化。   管理、丰富、洞察大数据   在数据管理层面,微软在Windows Server 和 Windows Azure上提供基于云或者内部服务的Hadoop服务——HDInsight,它构建于Hortonworks Data Platform之上,通过与System Center集成,HDInsight简化了Hadoop的管理,并支持IT部门在同一面板上管理Hadoop集群、SQL Server数据库和应用程序。微软还通过Active Directory使IT部门能够将同样一致性安全策略用于包括Hadoop集群在内的所有IT资产。   “对于企业传统环境,SQL Server完全可以满足企业对关系型关键业务系统的管理需求,非关系型数据可由Hadoop集群来承担,对于企业自建Hadoop 集群,HDInsight on Windows Server可以满足这一需求。对于云环境,我们有HDInsight on Windows Azure, 结合SQL Server Parallel Data Warehouse(PDW),客户

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档