- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联规则的推荐算法在游戏搜索引擎中的应用
互联网的出现彻底改变了我们的生活方式。
本文利用关联算法, 参照CRISP-DM建模流程
1 关联规则推荐算法
商业理解是定义商业目标的过程, 建模过程的关键也在于此.本文商业目标是通过用户搜索关键字来预测该用户对哪些Xbox游戏更感兴趣.显然, 这是一个预测型问题.解决预测型问题, 目前比较成熟的数据挖掘算法有线性、关联算法等
本文的关联规则推荐算法过程大致如下:
(1) 找出所有由关键字产品组成的关联规则Rules和点击率最高的top5产品Sku_top.
(2) 提取出Rules中每组关键字对应用户点击的top5产品, 记剩下的关联规则集为Rules_fmt.
(3) 根据Rules_fmt和测试集训练集中的关键字, 产生初始推荐规则表.
(4) 若推荐规则表中某一关键字没有推荐产品, 则给它推荐Sku_top产品;若某一关键字只有一个产品P, 则除了给它推荐P产品之外, 还补充推荐Sku_top中的前4种产品, 使其推荐产品中始终有5个产品.同理, 产生最终推荐规则表.
(5) 根据最终规则表和测试集用户所点击的关键字, 产生用户推荐表Rcmd.
2 数据预处理
数据准备是根据商业目标确定建模所需数据.本文数据直接由官方提供.获得数据后, 对数据进行检验和预处理以减小模型误差.本文数据预处理操作有:数据集成;大小写转换、去除特殊字符;语意转换, 即把音近和意近的变量值转换成一个变量值.
3 关联规则的生成
完成数据预处理之后, 进行建模.本文采用关联规则算法并根据用户搜索关键字对产品进行推荐, 算法流程有以下几步:
(1) 找出训练集中所有由用户输入的关键字 (转换后) Query_format用户点击的产品Sku组成的关联规则Rules (表1) 和点击率最高的top5产品Sku_top (表2) .
(2) 按转换后的关键字分组, 提取Rules表中每组关键字对应用户点击的top5产品记剩下的关联规则集为Rules_fmt (表3、表4) .删去top6、top7…规则.
(3) 根据Rules_fmt和测试集训练集中的关键字 (转换后) , 产生初始推荐规则表Rule1 (表5) .
(4) 转置Rules1得Rules2, 产生最终推荐规则表Rules_final (表6) .
(5) 根据最终规则表和测试集用户所点击的关键字, 产生用户推荐表Rcmd (表7) .
4 模型预测正确
本文采用预测准确性来评估模型, 模型准确率通过下面几个步骤得到:
(1) 利用最终推荐表和训练集中用户点击的关键字预测出各用户可能点击的产品.
(2) 若训练集中用户实际点击的产品在模型预测产品之中, 则对该用户来说, 型预测正确.
(3) 统计出模型预测正确的用户数在用户总数中的占比.据统计, 在训练集用户总数为42365, 第一种产品预测正确的用户数正确率为63.7%, 前两种产品预测正确率为81.0%;前三种产品预测正确率为87.8%;前四种产品预测正确率为90.4%;前五种产品预测正确率为91.9%.可见, 模型预测的前2种产品正确率超8成, 前4种超9成, 模型正确率较高.
(4) 结果部署是用建立的模型去解决实际中遇到的问题, 它还包括监督、维持、产生最终报表等过程.本例暂略去该过程.
5 快速与准确的建设算法
本文采用基于关联规则的推荐算法, 按照CRISP-DM建模流程, 通过用户搜索关键字, 预测并向该用户推荐他可能感兴趣的TOP5产品 (Xbox游戏) .
关键字的准确转换是该推荐系统正确率的直接保障.然而, 在商业推荐系统中, 我们不得不设计一种既快速又准确的关键字转换算法, 这将是优化推荐系统的又一挑战.
文档评论(0)