- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
中南大学
本科生毕业论文(设计)
题 目 基于客户资料挖掘的电子商务网站的设计与实现
学生姓名
指导教师
学 院 软件学院
专业班级 软件工程0401班
完成时间 2008年5月
目 录
摘 要 I
ABSTRACT II
第一章 绪论 1
1.1研究背景与现状 1
1.2个性化推荐系统综述 2
1.3个性化推荐系统的评价标准 4
1.4个性化推荐系统面临的挑战 5
1.4.1实时性问题 5
1.4.2数据与技术集成问题 5
1.4.3隐私问题 5
1.5论文组织结构 6
第二章 协同过滤推荐系统 7
2.1协同过滤推荐综述 7
2.1.1基于用户的协同过滤算法 7
2.1.2基于资源项的协同过滤算法 7
2.1.3 Slope One算法 8
2.2协同过滤推荐系统的流程 8
2.2.1兴趣数据的收集与处理 8
2.2.2最近邻搜索 10
2.2.3生成推荐结果 11
2.3协同过滤推荐的特性分析 12
2.3.1协同过滤推荐系统的优点 12
2.3.2协同过滤推荐系统的缺点 13
2.4 本章小结 13
第三章 协同过滤推荐系统设计 14
3.1 协同过滤推荐系统的总体设计 14
3.1.1 协同过滤推荐系统的设计目标 14
3.1.2协同过滤推荐系统总体框架 14
3.2数据管理DataManager的模块设计 15
3.2.1资源项模块 15
3.2.2用户偏好模块 16
3.2.3用户模块 16
3.2.4数据管理模块 16
3.3相关性算法实现的模块设计 17
3.3.1基于Pearson相关性算法 17
3.3.2基于资源项相关性算法 18
3.3.3基于Spearman相关性算法 19
3.4最近邻用户算法的模块设计 20
3.5个性化推荐 21
3.5.1基于资源项和用户的推荐 21
3.5.2 SlopeOne算法推荐 22
3.6基于用户聚类的推荐 23
3.7本章小结 25
第四章 实验结果及其分析 26
4.1数据集 26
4.2评价指标 27
4.2.1 测试准备 27
4.2.2 测试对象 27
4.3测试结果及分析 28
4.3.1相似度算法的影响 28
4.3.2最近邻体积的影响 28
4.3.3推荐质量的测试 29
4.3.4基于用户聚簇的测试 30
4.4本章小结 30
第五章 总结与展望 31
5.1总结 31
5.2展望 31
致 谢 33
参 考 文 献 35
摘 要
随着因特网在全球的普及和人们生活水平的提高,商品和服务信息指数级的增长造成的信息过载已经成为制约电子商务发展的瓶颈。伴随着电子商务平台的日益成熟,个性化的商品推荐已经成为满足个体对个性化商品信息需求的重要手段。
本课题针对目前在电子商务领域应用最成功也是最广泛的协同过滤推荐系统技术进行了学习研究,并具体实现了其中的典型算法――基于项目的和基于用户的协同过滤算法,Slope One算法等。在此基础上,针对随着电子商务系统用户数目和商品数目日益增加,在整个用户空间上寻找目标用户的最近邻居非常耗时,导致推荐系统的实时性要求难以保证的问题,提出并实现了一种基于用户聚类的协同过滤推荐算法,根据用户对项目评分的相似性对用户进行聚类,生成相应的聚类中心,在此基础上计算目标用户与聚类中心的相似性,从而只需要在与目标用户最相似的若干个聚类中就能寻找到目标用户的大部分最近邻居并产生推荐列表。
最后利用美国明尼苏达大学的世界上最大的开放数据集MovieLens进行了协同过滤算法不同衍化版本的实验分析,试验结果表明用户聚类的算法要比基于用户的算法在性能上要好得多,同时在质量上也比基于用户的算法要好。
关键词:
ABSTRACT
With the high-speed development of internet and improvement of people’s living, because of the exponential increment of products and services information, information overload and information disorientation are obstructions which restrain people from using inter
您可能关注的文档
- 毕业设计(论文)-带式输送机V带传动及一级直齿圆柱齿轮减速器的设计.doc
- 毕业设计(论文)-带式输送机传动滚筒的设计.doc
- 毕业设计(论文)-带式输送机的液压自动张紧及检测装置设计.doc
- 毕业设计(论文)-带式输送机摩擦轮调偏装置设计.doc
- 毕业设计(论文)-带式运输机传动装置传动系统--二级直齿圆柱齿轮减速器.doc
- 毕业设计(论文)-带式运输机减速器设计.doc
- 毕业设计(论文)-带自动分度机构的法兰盘加工回转工作台的设计.doc
- 毕业设计(论文)-电梯PLC控制设计.doc
- 毕业设计(论文)-电梯电气系统设计.doc
- 毕业设计(论文)-电梯控制电路系统设计.doc
- 毕业设计(论文)-基于蓝牙的工业开关量传送系统.doc
- 毕业设计(论文)-基于凌阳61板的数据处理系统.doc
- 毕业设计(论文)-基于模糊PID的恒温控制系统设计.doc
- 毕业设计(论文)-基于模糊控制技术摆动式球磨机控制系统设计.doc
- 毕业设计(论文)-基于模糊控制理论铅酸蓄电池充电方式的研究.doc
- 毕业设计(论文)-基于模糊控制算法的温度控制系统的设计.doc
- 毕业设计(论文)-基于嵌入式ARM的液晶菜单的设计.doc
- 毕业设计(论文)-基于全IP技术的3G核心网络的研究.doc
- 毕业设计(论文)-基于射频控制的智能照明系统设计.doc
- 毕业设计(论文)-基于神经网络的空气质量检测.doc
文档评论(0)