- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
美国数据科学家带你看看大数据的未来
从SG1的首席科学家John R?MAsey在1998年提出大数据概念,到大数据分析技 术广泛应用于社会的各个领域,已经走过了 17年的时间。现在再也没有企业怀疑大数 据分析的力量,并且都在竞相利用人数据来增强自己企业的业务竞争力。但是,即使 17年过去,大数据分析行业仍然处于快速发展的初期,每时每刻都在产生新的变化。
从概念到实用、从结构化数据分析到非结构化数据分析,大数据分析技术在不断地进化。 虽然国内仍然在关注舆情分析,但是记者注意到,在美国,人数据分析的研究已经进入 到了一个全新的阶段,、、预测分析〃技术成为最具有代表性的未来技术方向。
那么,、、预测分析〃技术和传统的大数据分析有什么不同?记者就此采访了美国数据科学 家、前北卡大学夏洛特分校助理敎授、夏洛特视觉中心主任以及非结构化数据智能分析 平台 Taste Analytics 的 CEO, Derek Wang (汪晓宇)博士。
错误!不育E读取或显示文件。大数据行业爆发,现在的技术不够
用了
汪晓宇博丄?正好经历了整个大数据产业爆发的全过程。他和记者回忆说,在2010年的 时候,来他们夏洛特视觉中心进行交流的还仅仅是人公司的数据硏究员,2011年已经 变成了公司的主任,而到了 2012年,來的几乎全是CIO和CTO们了。他们甚至还为 企业开了一门数据分析的进修课程,讲座虽然只有两天,但注册洋费几千美金,学员们 全都是来自国内各大公司的资深高管。 从这可以看岀,在这个数据时代,屮美都在用尽一切办法实现数据上领先的概念和追求。 而在这技术飞速发展的几年间,数据本身呈现出了不少新的特点,市场也相应地对大数 据分析技术提出了新要求。
首先,数据点越来越多,也越来越碎片化
在汪晓宇博丄?看来,人数据时代就是人的时代,数据形态越来越丰富和多样。除去社交 网站等传统数据点以外,新形态的数据点也已经出现,比如Airbnb和Uber这种020 服务。如果再看远一点,随着可穿戴设备、物联网等先进设备和个人的信息结合起來, 随时随地产牛和收集数据更加成为可能。
错误!不能读取或显示文件。
在这样的悄况下,每个人随时随地的、悄绪〃和状态〃这些都会成为商家必须要重视的 数据源。与此相对应的,非结构化数据分析将越來越垂要。而非结构化数据的模块化更 加灵敏,不是传统的单一解决方案可以做到的。这导致人们在进行大数据分析时使用的 工貝将更加细化,利用垂直创新的工貝进行非常纵深的研究将成为主流。
其次,大数据分析技术成为了决定社会服务效率的关
有报道指出,随着信息技术的发展,包括公共服务、物流等在内的人们衣食住行的服务
会纷纷电子化,虚拟世界和物理世界的边界将进一步模糊。这个大的产业背景一旦形成, 人数据分析能力就将成为整个产业服务最关键的竞争力。 这样就意味着,大数据分析T具应该越来越实用化。汪晓宇博士介绍说,在面对新的技 术和工具时,美国企业高层都会迅速做出决断,考虑怎么把数据分析和现有业务进行快 速整合。他举例说,在他们和美国一家大型银行合作时,对方的CIO就可以迅速做出 反应,和他们探讨应该怎么把他们开发的创新型非结构化数据分析技术应用到自家银行 某一个产品中去。
决定下一代大数据产业的新技术:“预测分析”
在这样的数据特点和市场耍求下,中国和美国各人公司和科研中心都在人力投入,研发 下一代数据分析技术。但是,在这方而,美国还是有着3-5年时间的领先。
根据汪晓宇博士的分析,国内在科研上的眼光很高,水平层次力度都在,但是商业化不 行,研发出来转到应用上和美国有一定差距。中国大部分公司对于大数据分析的概念还 停留在、舆情分析〃的阶段,但是美国已经跨越舆情分析〃和、情感分析〃,进入到了预 测分析〃阶段。
由汪晓宇博士一手打造的Taste Analytics团队,就在进行预测分析〃技术的研发。 它摆脱了传统的舆情分析〃和情感分析〃的框架,更进一步,把人们在社交网站和英 他平台上产生的数据都收集起来,进行实时、全面地分析,帮助企业建立用户的立体形 象,了解他们的品味和喜恶,从而提供预测性地判断。这听來似乎和传统的推荐系统〃、 类Clickstream分析有些类似,但是实际上完全不同。 首先,传统的、推荐系统〃会需要一个很长的建立过程,也就说,它需耍很多强相关的、 相似的历史数据,才有可能实现推荐功能。比如它只能根据你买电饭锅的行为,才能向 你推荐其他厨具。
但是企业怎么能在一开始就知道,顾客想要买电饭锅呢?这就是、、预测分析〃的强大之 处。它不需要这样的历史数据,而是直接通过人们在社交网络上的留言和在各大平台上 聃下的信息,来进行预测。也就是说,当你在社交网络上留卜类似、好想在家做饭〃的状 态,系统就有可能已经知道你想买厨具了。
汪晓宇博士举例说,预测分析〃技
原创力文档


文档评论(0)