- 1、本文档共18页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
【PPT】管中窥豹:用大数据洞察用户
论文类别:计算机论文下载 - 互联网研究论文下载
上传时间:2015/4/3 9:07:00
论文作者:未知
论文版本:简体版 繁体版 英文版
(免费论文下载中讯) “百分点大数据技术沙龙——管中窥豹:用大数据洞察
用户”在Binggo咖啡已圆满落幕。共有涵盖金融、电信、能源、互联网等10
多个行业的大数据技术、产品、市场相关人员参加。“百分点大数据技术沙
龙”是由百分点发起的为大数据领域相关技术人员举办的系列技术沙龙,本次
百分点技术专家刘译璟博士和李海峰为大家分享了百分点大数据用户画像的概
念和方法,以及如何构建和应用,中关村大数据产业联盟副秘书长陈新河作为
特邀嘉宾从宏观的视野分析了大数据发展路径。
陈新河分享了 《画像——大数据征程的起点》主题报告。他认为,大数据是
物理世界在网络世界的映射,是一场人类空前的网络画像运动。网络世界与物
理世界不是孤立的,网络世界是物理世界层次的反映。数据是无缝连接网络世
界与物理世界的DNA。发现数据DNA、重组数据DNA是人类不断认识、探索、实
践大数据的持续过程。
图1 大数据发展路径
陈新河把网络画像分为行为画像、健康画像、企业信用画像、个人信用画
像、静态产品画像、旋转设备画像、社会画像和经济画像等八类,并通过实践
案例进行了阐释。
未来,人生的每个历程无时无刻不由数据驱动。、
2
图 数据驱动人生
未来,设备全生命周期也将由数据驱动。
图3 数据驱动汽车全生命周期(海略咨询)
刘译璟博士首先从百分点推荐引擎开始,深入探讨了四大引擎。
场景引擎:个性化的核心,判断用户处于哪个购物环节,有什么样的购物目
标;
规则引擎:业务的核心,结合用户、场景、算法输出数据和业务KPI,决定
为用户推荐哪些内容;
算法引擎:计算用户之间的相似度、商品之间的相似度、用户对商品的评
分、用户分群、热门排行……
展示引擎:将推荐内容以最佳的展示方式呈现在用户面前。
推荐引擎的核心是将购物流程数据化,而其前提是将用户数据化。如何将用
户数据化呢?就是用户画像。
刘译璟博士用几个生活中画像的例子生动地阐释了什么是用户画像。
用户画像的目标、方式、组织、标准和验证等几个特点。
他认为用户侧写可能更加准确的描述 “用户画像”这个词,因为我们是通过
有限的信息来描述一个人,而非通过全息相机照相的模式来描述一个人。
从技术角度来看,人在网络空间是一个比特流,人们认识人的方式发生重大
改变,由物理空间的 “相面”转变为网络空间比特流解析,更重要的是教会机
器按照人类交给他的规则从这些比特流进行自动识别。能够从千万计的用户中
找出金融诈骗者、恐怖分子等。
如何实现这一过程?这就需要一种类似成像技术中的像素来对人的特征进行
刻画,这就是画像中的标签。
大数据用户画像其实就是对现实用户做的一个数学模型,在整个数学模型
中,其核心是,怎么描述业务知识体系,而这个业务知识体系就是本体论,本
体论很复杂,我们找到了一个特别朴素的实现,就是标签。建好模型以后,要
在业务的实践中去检验,并且不断完善,不断丰富这个模型,来达到利用比特
流对人越来越精确的理解。用户画像不是一个数学游戏,不是一个技术问题,
实际上是一个业务问题。因为最核心的是你去如何理解用户,了解你的用户。
它是技术与业务最佳的结合点,也是一个现实跟数据的最佳实践。
李海峰分享了百分点在用户画像方面的实践和案例。
他首先以自己为例分享了画像样例。基于他这个人可以知道他所在的城市是
在北京,男性,公司在百分点,喜欢的品类是男鞋、运动鞋,喜欢的品牌有耐
克、阿迪达斯等等。每一个标签都有一个权重值。可以看到,耐克的权重值比
阿迪达斯更高一些。
这幅图是通过云图的方式对百分点创始人/董事长兼CEO苏萌进行的特征画
像。
百分点的画像标签体系包括:人口属性、上网特征、营销特征、内容偏好、
兴趣偏好等。
以手机商品属性为例,包括品牌、品类、型号、上市时间、价格、颜色、网
络、操作系统、分辨率、屏幕尺寸等等。
标签管理体系具有如下特性。
有多种标识方式对用户进行识别,这就像社会生活中的身份证号码一样,只
不过换成了网络空间的手机号、Cookie、IMEI、Email、微博、微信账号等,在
处理过程中,这些信息都是加密的,机器知道但人不知道。
百分点用户画像逻辑架构如下图所示,通过对电商、社区、移动应用、微
博、微信等多种类别的数据源进行采集,然后对用户进行画像,
您可能关注的文档
- 无论如何你都会被卷入内容营销的大潮?.pdf
- 无人驾驶就是下一个“智能手机”.pdf
- 分析:从另一个角度看互联网行业里的老大老二合并.pdf
- 无人驾驶离我们还有多远?.pdf
- 无人驾驶立法为何步履维艰?.pdf
- 分析:大数据背后的网络文学是繁荣还是平庸?.pdf
- 无人驾驶要征服世界得先解决这些问题.pdf
- 分析:大数据下的北京雾霾经济.pdf
- 五大关键词梳理人工智能的2015年.pdf
- 分析:当插线板站在风口“互联网”是颠覆还是互补.pdf
- 浙江衢州市卫生健康委员会衢州市直公立医院高层次紧缺人才招聘11人笔试模拟试题参考答案详解.docx
- 浙江温州泰顺县退役军人事务局招聘编外工作人员笔试备考题库及参考答案详解一套.docx
- 江苏靖江市数据局公开招聘编外工作人员笔试模拟试题及参考答案详解.docx
- 广东茂名市公安局电白分局招聘警务辅助人员40人笔试模拟试题带答案详解.docx
- 江苏盐城市大丰区住房和城乡建设局招聘劳务派遣工作人员4人笔试模拟试题带答案详解.docx
- 浙江舟山岱山县东沙镇人民政府招聘笔试模拟试题及参考答案详解1套.docx
- 最高人民检察院直属事业单位2025年度公开招聘工作人员笔试模拟试题含答案详解.docx
- 浙江金华市委宣传部、中共金华市委网信办所属事业单位选调工作人员笔试备考题库及答案详解1套.docx
- 广东深圳市党建组织员招聘40人笔试模拟试题及答案详解1套.docx
- 江苏南京水利科学研究院招聘非在编工作人员4人笔试模拟试题及参考答案详解.docx
最近下载
- 《中国结核病预防控制工作技术规范(2020年版)》.PDF VIP
- 2023年北京市中考英语真题(含答案) .pdf VIP
- 南通大学2023-2024学年《病理学》期末考试试卷(A卷)附参考答案.docx
- 胸部损伤-教学课件.ppt VIP
- 某银行数据中心搬迁整体实施方案.pdf VIP
- 麦肯锡中国银行业CEO季刊(2020年秋)-麦肯锡-224页正式版.pdf VIP
- 国家公务员录用考试体检标准.doc VIP
- 入党申请书时事政治精选五篇.docx VIP
- 农村公路安全生命防护工程监理规划49943.doc VIP
- 高中英语3500词【打印版】乱序版3500词汇(带音标120页).pdf VIP
文档评论(0)