- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
数据挖掘方法简介聚类分析
目的:根据分析对象的相似性和差异性分群,从而了解不同群体行为特征和需求。思想:物以类聚,人以群分。案例:玩家区隔分析聚类分析所有个体聚类分析聚类分析群体一群体二群体三群体四聚类分析
案例简介:资料:在线时长、上线次数、上线时长、充值次数、充值金额、技能数量、仇人数量、好友数量、完成任务次数、幻兽数量、配偶数量、加入家族数量、加入军团数量(玩家升至60级的累计数量)。分析方法:k-means、两步聚类等聚类分析
结果:将到达60级的玩家分成五个群体:高价值贡献者、不热衷社交的游戏技巧专家、全方位平衡玩家、重视技巧的社交连接者和打发时间者。应用:1)可根据不同群体的特征,改进游戏的玩点。2)可描述出不同群体的特征及需求,从而使个性化服务成为可能。判别分析
案例同“聚类分析”案例目的:对未参加分群的玩家进行类别归类,即,当新的玩家达到60级时,判断他属于哪种类型,从而投其所好,提出其所需的玩点和需求。思想:假定玩家群体稳定,预测新玩家类别。判别分析建模数据(已知分类)利用工具建立模型得到判别方程式类别1类别4类别2类别3判别分析判别方程输入输出新样本判别结果判别分析分析方法:判别分析(也可用多项Logistic回归等模型)结果:当一个玩家到达60级时,把其属性指标代入判别方程或其它恰当的模型,判断其属于上述5类中的哪一个类别。游戏中的可能应用:当有需求点对点接触玩家时,可用该方法判别玩家群体。也可对人为已分好的群体进行判别分析。分类估计和预测
案例:有线电视服务销售。目的:找出愿意预订有线电视交互服务的用户。思想:根据已有资料预测新用户是否响应某种服务或活动。案例介绍:资料:用户的年龄、性别、教育、收入、每天看电视的时间和子女数、是否有意预定有线电视交互服务。分类估计和预测分析方法:分类回归树、二项Logistic回归、C5.0模型等根据已有客户上述资料用分类回归树方法对有线电视交互服务响应情况归纳规则,当提供新用户属性资料时,将该资料输入模型,则预测出该新客户是否响应该服务。分类估计和预测模型训练集工具建模决策树模型决策列表模型神经网络模型Logistic回归模型……建立模型评价模型选出多个较优的模型分类估计和预测选出的多个较优模型进出模型测试集测试模型精度判断模型好坏选出最优模型分类估计和预测估计或预测样本最优模型输入输出估计或预测结果分类估计和预测结果:预测用户是否愿意预订有线电视交互服务及预订该服务的概率。应用:针对愿意预订该服务的客户或者针对预订该服务的高概率用户进行营销,做到有针对性的营销。在游戏中的可能应用:玩家流失预测。市场购物篮分析(规则归纳)
案例:超市购物篮分析目的:找出消费者所购买商品之间的联系并归纳其规则,并描述购买产品组的购买者特征。思想:根据历史购买数据归纳购买者的购买习惯和行为。市场购物篮分析(规则归纳)案例介绍:资料:顾客的性别、年龄、收入等属性特征,购买价格、支付方法及所购买产品类别的相关信息。分析方法:GRI-归纳所购物品之间的关联;决定树C5.0-分析购买物品的玩家特征。市场购物篮分析(规则归纳)结果:1)购买鱼的顾客还同时购买果蔬;2)购买酒的顾客还同时购买糖果;3)购买啤酒、冻肉的顾客同时购买罐装蔬菜。应用:1)可以根据关联规则,将顾客习惯性一起购买的物品放在一起销售或打包销售;2)自定义某类产品与其人口特征的需求匹配。在游戏中的应用:打包销售虚拟物品。欺诈行为
案例:农业发展财政补贴申请中的欺诈探测。目的:在申请农业财政补贴时,是否存在欺诈行为。思想:用估计值(预测值)与实际值之间差值的大小来判断个体行为是否异常。欺诈行为
案例介绍:资料:申请补贴田地的相关信息,包括申请序号、申请人姓名、田地所在区域、田地大小、降雨量、田地的收入、主要农作物、申请类型和申请金额。分析方法:根据资料中相关数据,用异常值诊断及各种预测模型相结合的方法建模。欺诈行为
结果:预测结果与实际值的差值超过一定的临界值则判定为异常。应用:找出的异常值再做进一步的调查,确认其是否是欺诈行为。在游戏中的可能应用:工作组探测、小号角色探测**
原创力文档


文档评论(0)