- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
电子商务网站智能推荐服务;;分析原始数据发现不符合规则的网页包括中间页面的网址、咨询发布成功页面、律师登录助手的页面等,统计进行删除处理的不符合规则的网页数据,如表所示。;本案例主要对知识相关的网页类型数据进行分析,统计用户访问知识页面的翻页情况,如表所示。;处理翻页情况最直接的方法是将翻页的网址删掉,但是用户是通过搜索引擎进入网站,访问入口不一定是原始页面,采取删除方法会损失大量有效数据,影响推荐结果。因此对该类网页的处理方式首先识别翻页的网址,然后对翻页的网址进行还原,最后针对每个用户访问的页面进行去重的操作,操作结果如表所示。;为了得到更好的推荐结果,在处理数据的过程中对访问网页数据进行进一步分类,如图所示。知识类是由婚姻、劳动等小的类别组成。原始数据中知识类无法进一步进行内部分类,结合业务采用网址构成的方法对知识类网页内部进行分类。;对用户访问知识页面的翻页记录进行分类,分类的结果如表所示。;统计每一类中的记录,统计结果以知识类别中的婚姻法为例,如表所示。;由于推荐系统模型的输入数据需要,需对处理后的数据进行特征选择,选择符合模型输入要求的特征。根据分析目标得出,知识是该企业主要业务来源之一,故筛选知识相关的用户和用户访问网页记录,将该类网页用户和用户访问数据作为模型分析的输入数据。
因此将其他的特征删除,选择的用户与用户访问网页记录,其输入数据集如表所示。;;本案例基于物品的协同过滤系统的一般处理过程,分析用户与物品的数据集,通过用户对案例的浏览与否(喜好)找到相似的物品,然后根据用户的历史喜好,推荐相似的案例给目标用户。基于物品的协同过滤推荐系统图如图所示。;根据协同过滤的处理过程可知,基于物品的协同过滤算法(简称ItemCF算法)主要分为2个步骤。
计算物品之间的相似度。
根据物品的相似度和用户的历史行为给用户生成推荐列表。
;基于协同过滤推荐算法主要包括两个部分:基于用户的协同过滤推荐和基于物品的协同过滤推荐。
结合实际的情况分析判断,选择基于用户的协同过滤推荐???法进行推荐,构建模型的流程如图所示。;优点:可以离线完成相似性步骤,降低了在线计算量,提高了推荐效率;并利用用户的历史行为给用户做推荐解释,结果容易让客户信服。
缺点:现有的协同过滤算法没有充分利用到用户间的差别,使计算得到的相似度不够准确,导致影响了推荐精度;此外,用户的兴趣是随着时间不断变化的,算法可能对用户新点击兴趣的敏感性较低,缺少一定的实时推荐,从而影响了推荐质量。
;协同过滤算法可以使用recommenderlab包中的Recommender函数来实现,其语法格式如下。
Recommender(data,method,parameter=NULL,...)
常用参数及其说明,如表所示。;评价一个推荐系统好坏可以从用户、物品提供者、提供推荐系统网站几个方面进行考虑。好的推荐系统不仅能预测用户的行为,而且能帮助用户发现可能会感兴趣,实际浏览中却不易被发现的物品。评测指标主要有3种评测推荐效果的实验方法,即离线测试、用户调查和在线实验。
本案例模型是采用离线的数据集构建的,因此模型评价采用离线测试的方法获取评价指标,评测指标的公式如表所示。
;另外,用户只有二元选择,比如:喜欢与不喜欢,浏览与否等。对这类型的数据预测,就需要使用分类准确度,其中的评测指标有精确率(precesion),它表示用户对一个被推荐产品感兴趣的可能性。召回率(recall)表示召回率表示一个用户喜欢的产品被推荐的概率。F1指标表示综合考虑精确率与召回率因素评价算法的优劣的方法。分类准确度指标说明如表所示。;对婚姻知识类的数据进行模型构造,通过3种推荐算法,以及不同K值(推荐个数,K取值为3、5、10、15、20、25)的情况下所得出的精确率与召回率的评价指标。婚姻知识类精确率-召回率图如图所示。;通过基于协同过滤算法构建的推荐系统,婚姻知识类得到了针对每个用户的推荐,并且根据访问网址给出了相应的推荐相似度排名前5的案例,其婚姻知识类推荐结果如表所示。;;本案例主要介绍了协同过滤算法在电子商务领域中实现用户个性化推荐的应用。通过对用户访问网页日志的数据进行分析与处理,采用基于物品的协同过滤算法进行建模分析,最后通过模型评价与结果分析,得到智能推荐模型。同时分析协同过滤算法优缺点,并对于其缺点提出了改进的方法。;
您可能关注的文档
- 第9章 餐饮企业综合分析(2).pptx
- 第5章 金融服务机构资金流量预测.pptx
- 第6章 P2P信用贷款风险控制.pptx
- 第7章 电子商务网站智能推荐服务(1).pptx
- 第9章 餐饮企业综合分析(1).pptx
- 甘肃天水甘谷一中2025年高三第一次阶段性考试(4月考)语文试题含解析.doc
- 宁夏理工学院《佛教史》2023-2024学年第一学期期末试卷.doc
- 2025年湖南省浏阳市重点中学初三毕业班摸底考试英语试题含答案.doc
- 大同煤炭职业技术学院《植物生理学》2023-2024学年第二学期期末试卷.doc
- 广东省深圳市南山区实验教育集团2024-2025学年七年级数学第一学期期末调研试题含解析.doc
- 湖北工业大学《药物制剂工程与实践》2023-2024学年第一学期期末试卷.doc
- 中国音乐学院《临床医学概要Ⅱ》2023-2024学年第一学期期末试卷.doc
- 呼伦贝尔职业技术学院《人工智能与信息社会》2023-2024学年第二学期期末试卷.doc
- 2025届河北省“五个一”名校联盟化学高二下期末考试试题含解析.doc
- 2025年福建省泉州台商投资区初三冲刺3月训练卷(四)生物试题含解析.doc
- 三亚航空旅游职业学院《数据科学与工程导论》2023-2024学年第二学期期末试卷.doc
- 内蒙古北方职业技术学院《璀璨绚烂的中国传统节日》2023-2024学年第二学期期末试卷.doc
- 2025年安徽省宿州市埇桥集团校初三联合调研考试(英语试题理)试题含答案.doc
- 新《国际法》知识点学习考试题(附答案).doc
- 营运资本管理策略与案例分析.pdf
最近下载
- 机械设计、制造工艺、质量检测与标准规范(精).pdf VIP
- 方物深信服竞争分析_sangfor vmp v3.0manual.pdf VIP
- 集装箱材料技术要求..doc VIP
- 工程招标毕业答辩ppt.pptx VIP
- 大连理工大学操作系统2015期末试卷.pdf
- 2024年吉林省中考生物试卷(附参考答案).pdf VIP
- 集装箱材料技术要求.doc VIP
- 第三单元第1课《凝固的音乐》教学课件-2025-2026学年桂美版(2024)初中美术七年级上册.pptx VIP
- 集装箱材料技术要求[整理].pdf VIP
- 大连理工大学《操作系统》2021-2022学年期末试卷(1).pdf VIP
原创力文档


文档评论(0)