管中窥豹:用大数据洞察用户.pdf

  1. 1、本文档共18页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【PPT】管中窥豹:用大数据洞察用户 论文类别:计算机论文下载 - 互联网研究论文下载 上传时间:2015/4/3 9:07:00 论文作者:未知 论文版本:简体版 繁体版 英文版 (免费论文下载中讯) “百分点大数据技术沙龙——管中窥豹:用大数据洞察 用户”在Binggo咖啡已圆满落幕。共有涵盖金融、电信、能源、互联网等10 多个行业的大数据技术、产品、市场相关人员参加。“百分点大数据技术沙 龙”是由百分点发起的为大数据领域相关技术人员举办的系列技术沙龙,本次 百分点技术专家刘译璟博士和李海峰为大家分享了百分点大数据用户画像的概 念和方法,以及如何构建和应用,中关村大数据产业联盟副秘书长陈新河作为 特邀嘉宾从宏观的视野分析了大数据发展路径。 陈新河分享了 《画像——大数据征程的起点》主题报告。他认为,大数据是 物理世界在网络世界的映射,是一场人类空前的网络画像运动。网络世界与物 理世界不是孤立的,网络世界是物理世界层次的反映。数据是无缝连接网络世 界与物理世界的DNA。发现数据DNA、重组数据DNA是人类不断认识、探索、实 践大数据的持续过程。 图1 大数据发展路径 陈新河把网络画像分为行为画像、健康画像、企业信用画像、个人信用画 像、静态产品画像、旋转设备画像、社会画像和经济画像等八类,并通过实践 案例进行了阐释。 未来,人生的每个历程无时无刻不由数据驱动。、 2 图 数据驱动人生 未来,设备全生命周期也将由数据驱动。 图3 数据驱动汽车全生命周期(海略咨询) 刘译璟博士首先从百分点推荐引擎开始,深入探讨了四大引擎。 场景引擎:个性化的核心,判断用户处于哪个购物环节,有什么样的购物目 标; 规则引擎:业务的核心,结合用户、场景、算法输出数据和业务KPI,决定 为用户推荐哪些内容; 算法引擎:计算用户之间的相似度、商品之间的相似度、用户对商品的评 分、用户分群、热门排行…… 展示引擎:将推荐内容以最佳的展示方式呈现在用户面前。 推荐引擎的核心是将购物流程数据化,而其前提是将用户数据化。如何将用 户数据化呢?就是用户画像。 刘译璟博士用几个生活中画像的例子生动地阐释了什么是用户画像。 用户画像的目标、方式、组织、标准和验证等几个特点。 他认为用户侧写可能更加准确的描述 “用户画像”这个词,因为我们是通过 有限的信息来描述一个人,而非通过全息相机照相的模式来描述一个人。 从技术角度来看,人在网络空间是一个比特流,人们认识人的方式发生重大 改变,由物理空间的 “相面”转变为网络空间比特流解析,更重要的是教会机 器按照人类交给他的规则从这些比特流进行自动识别。能够从千万计的用户中 找出金融诈骗者、恐怖分子等。 如何实现这一过程?这就需要一种类似成像技术中的像素来对人的特征进行 刻画,这就是画像中的标签。 大数据用户画像其实就是对现实用户做的一个数学模型,在整个数学模型 中,其核心是,怎么描述业务知识体系,而这个业务知识体系就是本体论,本 体论很复杂,我们找到了一个特别朴素的实现,就是标签。建好模型以后,要 在业务的实践中去检验,并且不断完善,不断丰富这个模型,来达到利用比特 流对人越来越精确的理解。用户画像不是一个数学游戏,不是一个技术问题, 实际上是一个业务问题。因为最核心的是你去如何理解用户,了解你的用户。 它是技术与业务最佳的结合点,也是一个现实跟数据的最佳实践。 李海峰分享了百分点在用户画像方面的实践和案例。 他首先以自己为例分享了画像样例。基于他这个人可以知道他所在的城市是 在北京,男性,公司在百分点,喜欢的品类是男鞋、运动鞋,喜欢的品牌有耐 克、阿迪达斯等等。每一个标签都有一个权重值。可以看到,耐克的权重值比 阿迪达斯更高一些。 这幅图是通过云图的方式对百分点创始人/董事长兼CEO苏萌进行的特征画 像。 百分点的画像标签体系包括:人口属性、上网特征、营销特征、内容偏好、 兴趣偏好等。 以手机商品属性为例,包括品牌、品类、型号、上市时间、价格、颜色、网 络、操作系统、分辨率、屏幕尺寸等等。 标签管理体系具有如下特性。 有多种标识方式对用户进行识别,这就像社会生活中的身份证号码一样,只 不过换成了网络空间的手机号、Cookie、IMEI、Email、微博、微信账号等,在 处理过程中,这些信息都是加密的,机器知道但人不知道。 百分点用户画像逻辑架构如下图所示,通过对电商、社区、移动应用、微 博、微信等多种类别的数据源进行采集,然后对用户进行画像,

您可能关注的文档

文档评论(0)

10301556 + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档