- 1、本文档共11页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
数据产品设计的3个方法论 (附淘宝系解析 )
写这篇小文主要是因为这几年 是阴错阳差地与数据打着不大不小的交道 ,也是想 结一下
自己对数据产品的一些思考和认识 ,看看自己是否真的适合在这条路上一直走下去。
何谓数据产品
按照惯例 ,第一次听说数据产品这个词 ,毫不犹豫的百度之 ,搜索出现了三个比较有意思的结果 :
其一是虎嗅网的老读悟发表的 《数据产品经理的前世今生》 ;其二是 “最新招聘信息6136条_数据产
品经理” ,基本属于杭州某大型互联网公司 ;其三是innovat e511的最新微博显示 :“做数据挖掘研究
,如果做应用产品没有话语权 ,且要你承担结果是否上线产生价值的责任 ,那就别做 ,责任和权利
要成正比 ,否则你将面对一次又一次被拒绝开发或被优先级不高拖延 ,最后被拖死。”
innovat e511的最新微博
不知道这是不是印证了若不是找工作也不会跟数据产品结梁子呢,呵呵!言归正传 ,数据产品这个词
目前看起来还是来自职位描述 ,至于什么叫数据产品 ,大约业界还没有定论。
姑且引用老读悟的定义 :
数据产品是可以发挥数据价值去辅助用户更优的做决策(甚至行动)的一种产品形式。它在用
户的决策和行动过程中 ,可以充当信息的分析展示者和价值的使能者。从这个角度讲 ,搜索
引擎、个性化推荐引擎显然也是数据产品。狭义范畴的数据产品 ,比如大家熟知的淘宝数据
魔方、百度指数、电商的CRM平台、各种公司内部的数据决策支持系统等都是数据产品。
搜索引擎、推荐引擎代表了当今数据挖掘领域最成功的商业案例 ,而魔方、指数、CRM等产品也是
数据分析和决策的典型应用 ,因此老读悟的这个定义我还是相当认同的 ,或者更简单的说 ,凡是以
数据价值驱动为核心的产品形式都是数据产品 ,说得更艺术一点 , t he art of t urning dat a int o
product 。
方法论
这里主要探讨一下 ,如何设计或者评价数据产品?也就是方法论的问题。说到数据产品 ,不能不提一
下数据分析和数据挖掘。常碰到某牛人对着报表鄙视的说这叫数据分析 ,根本算不上数据挖掘 ,但
是在我的理解里 ,数据分析其实也是数据挖掘 ,只是一种浅层次但是非常简洁有效的数据挖掘形式
而已 ,因此后文不再使用数据分析这个词 ,而是围绕数据挖掘来思考数据产品的本质。
《 at a Mining Techniques》这本书里对数据挖掘的定义是 :数据挖掘是一项探测大量数据以发现
有意义的模式和规则的业务流程。“发现有意义的模式和规则”也就是我理解的价值驱动与业务目标
,进一步的这些任务又可归纳为分类和预测、评估、关联规则、聚类、孤立点等 ,而为了解决上述
任务所需要的方式方法则包括各种统计学模型、决策树、聚类算法、人工智能等等数学和计算机
技术。
数据挖掘的方法论有很多种定义 ,有 MA IC模型 ,CRISP- M模型 ,SEMMA模型等等 ,虽然细节
不一 ,但是大体流程并无差异。我个人比较喜欢简洁的 MA IC模型 ,一个是因为Kaushik的经
典 《Web A nalyt ics2.0》里遵循的思想便是这个 ,更重要的是它引入了循环控制的理念 ,而不是简
单的线性流程。 MA IC模型包括 :
1. ef ine定义需求 ,即把业务问题转化为数据挖掘问题
2. Measure 测量数据 ,即理解、收集并加工数据 ,做好准备
3. A nalyze 分析建模 ,即构建模型、评估模型的过程
4 . Improve 解决问题 ,即部署模型来解决目标问题
5. Co nt ro l反馈控制 ,即评估结果重新开始循环 ,不断改进
MA IC模型
基于数据挖掘的方法论 ,回头来理清产品设计的方法论。通常对于互联网产品设计 ,比较一致的观
点是 《用户体验要素》里面的五层模型 ,战略层→范围层→结构层→框架层→表现层。我相信对于
产品经理来说五层模型属于入门 ,但是对于不同类型的产品必然有不同的解读 ,比如SNS产品和电
商产品的五层模型关注的问题肯定有差异 ,因此这里还是以淘宝魔方为例赘述一遍自己对于数据产
品的五层模型理解。
1. 战略层 ,用户需求和产品目标 ,比如淘宝魔方的目标用户是品牌卖家 ,那么它到底帮助品牌卖家
用户解决什么问题?对于 MA IC来说 ,相当于解决 ef ine的问题 ,即数据要实现什么价值。
2. 范围层 ,功能规格和内容需要 ,
您可能关注的文档
- 如何做好市场的调查.ppt
- 第07章 环境影响评价技术导则-总纲.pdf
- 辽宁药品批发企业GSP认证检查评定标准(暂行).doc
- 兰蔻跨界要逆天 6大私人定制玩时尚!.pdf
- 行测技巧三十八规律摘要.pdf
- 创新理论及案例分析练习题.doc
- 多目标跟踪算法简介汇编.ppt
- 人体体液中细胞外microRNA的起源_功能和潜在诊疗价值_张苏洋.pdf
- 第三篇 短期流动性分析.ppt
- 2017年度一级建造师《工程经济》模考卷.pdf
- 数据仓库:Redshift:Redshift与BI工具集成.docx
- 数据仓库:Redshift:数据仓库原理与设计.docx
- 数据仓库:Snowflake:数据仓库成本控制与Snowflake定价策略.docx
- 大数据基础:大数据概述:大数据处理框架MapReduce.docx
- 实时计算:GoogleDataflow服务架构解析.docx
- 分布式存储系统:HDFS与MapReduce集成教程.docx
- 实时计算:Azure Stream Analytics:数据流窗口与聚合操作.docx
- 实时计算:Kafka Streams:Kafka Streams架构与原理.docx
- 实时计算:Kafka Streams:Kafka Streams连接器开发与使用.docx
- 数据仓库:BigQuery:BigQuery数据分区与索引优化.docx
文档评论(0)