- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
PAGE 1
PAGE 1
大数据,不是说有就能有
2016年可谓是中国的“大数据之年”,不仅国家推行“大数据战略”,倡导发展互联网新经济,各行各业也都在谈论大数据的前景。 2016年可谓是中国的“大数据之年”,不仅国家推行“大数据战略”,倡导发展互联网新经济,各行各业也都在谈论大数据的前景。国务院总理李克强5月出席大数据产业峰会并提出大数据驱动信息产业升级的战略导向。大数据一时成为了各大企业都争相推拥的热词。 单纯从字面理解,大数据描述的是一个巨量数据的概念。而在实际的应用上,“大数据”更类似“光年”一样,当光指引到时间中,就成为了描述距离的单位,而把海量的有效数据进行有针对性的整合分析时,他就可以对用户行为进行描述,为我们的生活供应各种各样的决策和指引。 图1大数据,不是说有就能有 随着国家大数据战略的推行,“数聚”、“精准”等概念纷纷涌现。然而,在各大品牌层出不穷的新玩法下,“大数据”概念被滥用的状况越来越严重。笔者之见,“大数据”能力需要有漫长积蓄过程,绝非“想用就能用”。 在品牌宣传上,大数据的概念常常被有意无意地偷换,主要表现在,“有数据”并不等于大数据。大数据存在5V的特征,即Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)、Veracity(真实性)。除了存有数据的基本条件外,还需满意以上五个维度。因此,大数据是一个特别严格的概念。 一个企业的大数据实力如何,主要基于其拥有的数据资产的数量和质量,同时也取决于数据的维度,及对海量数据的开发运用能力(内部算法)。因此不少巨头在不断扩张自己数据库容量的同时,也在通过并购整合,拓宽其自身数据资产的掩盖度和完整度,同时提升自己对数据的运算能力。 以阿里巴巴为例,阿里拥有浩大的用户群体以及十多年的用户数据积累。其大数据资产,无论从数量还是质量上,在中国处于肯定领先地位。但究其根本,其主要数据维度主要集中在电商领域。随着阿里巴巴不断的跨领域扩张,其大数据维度也随之丰富起来。UC浏览器、高德地图、优酷土豆、新浪微博等多个领域产品的加入,阿里大数据基于移动信息领域的矩阵渐渐扩展。截至目前,据不完全统计,阿里大数据矩阵至少包含了电商、阅读、社交、搜寻、地图、视频、应用、游玩等维度的用户行为数据,从掩盖率和完整度上,应当是目前BAT三大巨头中最具优势的。 图2大数据,不是说有就能有 然而,企业收集到“多维度”的数据只是第一步,如何运用、创造价值是接下来面临的考验。在数据价值的“落地”上,各个企业也正在积极探索。 移动互联时代深受“信息过载”的诟病,“如何实现信息与人更为精准的连接”是整个行业将来探索的方向。为了能够给用户供应最佳的内容获取决策,除了需要对数据宽度与厚度进行累积,还需要让数据变得更加“聪慧”。通俗来讲,企业需要能够对用户产生的每个数据进行统计、分析与开发,并以此帮助用户做出决策。 以UC为例,从阿里大数据中的高德地图POI数据可以知道用户当下处于的特定场景,依据对“时间+地点”的描述分发用户当下最需要的资讯;此外,在淘宝、神马搜寻、优酷等多维数据的互通下,可以知道用户对不同类型资讯的需求。此外,UC的算法还能实现依据不同领域按权重绘画属于该用户的用户画像,在基本的人群聚类下再连续进行需求分层。 以上用户数据的分析及处理,将形成个人定制化数据库,之后,再依据算法进行精准推送,目前常用的推荐算法有三种: 第一代基于“协同过滤”,即收集大量的用户浏览记录,通过相似行为进行关联推荐。由于算法简介,规律清楚,可行性强,这种算法被大多数企业采用,例如今日头条、每天快报等都是采用的这种算法,但其也存在缺陷。由于获取数据的手段有限,数据不能够真实的反应出用户对信息的需求,很简单让用户深陷在自己的“兴趣爱好”当中; 第二代基于“搜寻”,在分析了用户的核心兴趣点之后,通过隐式搜寻的方式,给用户结果,这是在搜寻引擎全面普及后出现的数据算法。但是与第一代算法类似的是,不同的人搜寻相同的信息有不同的目的,而不同的时间地点搜同样的信息也有不同的目的,用同样的标准衡量用户行为,简单产生误判;好处是,对第一代算法所产生的“信息孤岛”效应有了较大的减弱,较简单形成兴趣圈群。在这方面做得比较好的是一点资讯。 第三代基于“社群+场景”,从“人”的角度,切入到详细的社群,实现“人以群分”;从内容的角度,切入到详细场景,这也是目前算法的发展趋势,比较典型的是以阿里大数据矩阵为依托的UC头条。 不过,就目前而言,实现“社群+场景”精准分发还处于一个比较抱负的阶
您可能关注的文档
- 天津某电材公司精诚条码ERP实现现代化管理.docx
- 天河CAPP系统的实施体会.docx
- 天津市新技术产业园区管委会电子签章平台应用案例.docx
- 天津市北辰区检察院办公系统电子签名应用案例.docx
- 天河CAPP—集成化智能工艺设计管理平台系统.docx
- 天思软件灯饰行业显身手 凤光电器前途更明亮.docx
- 天士力集团医药营销CRM系统的建设.docx
- 天威大型变压器公司CIMS工程.docx
- 天心大型机械行业ERP实施案例.docx
- 天思ERP 为力达机械发展添动力.docx
- 2025-2026学年初中信息技术(信息科技)八年级下册(2018)清华大学版(2012)教学设计合集.docx
- 2025-2026学年初中信息技术上海科教版八年级第二学期-上海科教版教学设计合集.docx
- 2025年预制菜冷链物流智能温控报告.docx
- 2025-2026学年初中信息技术上海科教版七年级第二学期-上海科教版教学设计合集.docx
- 足浴的好处与方法.pptx
- 2025年工业互联网平台数据安全防护体系建设案例报告.docx
- 2025年智能康复机器人人机接口报告.docx
- 餐饮行业卫生管理检查表模板.docx
- 肾功能衰竭透析护理规范培训.pptx
- 2025-2026学年初中信息技术(信息科技)八年级下册川教版(2019)教学设计合集.docx
最近下载
- 《矿产资源_三率_指标要求 第 5 部分:金、银、铌、钽、锂、锆、 锶、稀土、锗》.pdf VIP
- 龙光集团丨纪凯婷人物介绍.pdf VIP
- 1访谈记录不忘初心方得始终.pdf VIP
- D-Z-T 0462.4-2023 矿产资源“三率”指标要求 第4部分:铜等12种有色金属矿产(正式版).docx VIP
- 无人机组装调试与检修-第五章-无人机系统调试.pptx VIP
- 无人机组装调试与检修-第四章-固定翼无人机系统组装.pptx VIP
- 无人机组装调试与检修-第二章-无人机装调工具与工艺.pptx VIP
- 无人机组装调试与检修-第一章-无人机系统概述.pptx VIP
- 卫星定位导航原理(哈尔滨工业大学)知到智慧树网课答案.docx
- T_CEIAESD 1005—2022_防静电不发火地坪施工与质量验收规范.pdf VIP
原创力文档


文档评论(0)