- 1、本文档共35页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
答辩PPT-基于知识库的礼品推荐系统的设计和实现
* * * * * * 系统实现-礼品知识库推理 if(节日场合) 查询节日场合规则获得该节日场合的ID; 根据节日场合ID查询节日场合礼品规则获得与该ID对应的礼品ID列表; 根据所有礼品ID查询礼品表,获得礼品信息列表; 返回礼品信息列表; else if(收礼人信息) 将收礼人信息分解成性别,年龄,兴趣爱好和与送礼人关系; if(年龄不为空) 查询年龄规则,获得该年龄所在年龄段的ID; if(兴趣爱好不为空) 查询兴趣爱好规则,获得该兴趣爱好的ID; if(与送礼人关系不为空) 查询关系规则,获得该关系的ID; 根据性别,年龄段ID,兴趣爱好ID和关系ID查询收礼对象规则,获得收礼对象ID; 系统实现-礼品知识库推理 根据收礼对象ID查询收礼对象礼品规则,获得与该ID对应的礼品ID列表; 根据礼品ID列表查询礼品表,获得礼品信息列表; 返回礼品信息列表; else if(收礼人描述) 将收礼人描述分解成性别,年龄,服饰特色,周末活动,性格,个人偶像; 查询收礼人描述规则,获得兴趣爱好; 组合性别,年龄和兴趣爱好递归调用推理过程执行第二个分支; 系统实现-礼品知识库知识获取 人工获取 选取二十名礼品专家并为每个用户分配一个账号登录知识获取系统,为每个用户随机选取若干个礼品,用户根据礼品的图片和介绍并结合自己的知识选择每个礼品适宜赠送的节日场合和收礼人的基本信息。然后系统将用户的输入的规则保存。 程序获取 假设礼品A未被人工初始化,而礼品B经过人工初始化,并且B是与A相似度最高的礼品,则A可根据B的知识库初始化信息进行初始化。通过这种方法,所有的礼品都可得到初始化。 系统实现-礼品相似度计算 礼品商家相似度计算 S1=1.0 (礼品A与礼品B是同一商家所卖) S1=0.0 (礼品A与礼品B不是同一商家所卖) 礼品类别相似度计算 S2 =1.0 (礼品A与礼品B是同一小类) S2 =0.5 (礼品A与礼品B是同一大类,不是同一小类) S2 =0.0 (礼品A与礼品B不是同一大类) 礼品价格相似度计算 价格50,P=0;50=价格100,P=1;100=价格200,P=2;200=价格500,P=3;500=价格,P=4。 S3= 礼品综合相似度计算 S = S1 * W1 + S2 * W2 + S3 * W3 (本系统取W1 = W2 = W3) 系统实现-礼品关联规则 定义:如果浏览过礼品A的所有用户也浏览过礼品B,且礼品B是这些用户浏览的最多的礼品,则礼品B是礼品A的关联礼品。 关联礼品的计算步骤如下: 1) 从用户浏览日志中取得数据。 2) 从用户浏览日志数据中统计所有被浏览过的礼品。 3) 对所有被浏览过的礼品循环统计浏览过同一礼品的所有用户并保存到数 据库。 4) 对浏览过同一礼品的所有用户统计其浏览过的最多次数的礼品。并将浏览次数最多的三个礼品保存到数据库中。 系统实现-礼品搜索 实现中的难点: 信誉的量化 将淘宝的20个等级信誉量化到0.1 – 1.0的区间 价格的排序 将价格乘以100然后前面补0,直到总位数达到10. 例如:120.00 ? 0000012000 索引性能的提高 同步合并因子 -- 30倍 搜索性能的提高 Search类采用单例模式,充分利用Lucene的缓存 -- 10倍 系统实现-推荐反馈 反馈记录 日志记录用户所有的浏览点击行为 反馈学习 根据用户日志,调整推荐结果排序,推荐结果的排序公式为: 其中,Si表示i推荐结果的本次排序值 S0表示i推荐结果的初始排序值 Bj表示i推荐结果第j次推荐是否被用户浏览,是为1,否为0. Pj表示i推荐结果第j次推荐所在的页数 系统性能测试-测试环境与工具 压力测试环境 (1) 服务器配置 处理器:奔腾III 内存:1G (2) 操作系统 Windows Server 2003 (3) 数据库 Oracle 10g (4) Web服务器 Tomcat 6.0(注:Tomcat和Oracle安装到同一台服务器上) 压力测试工具 Jmeter 2.4 压力测试样例 并发执行4组http请求,每组执行5次,共同时并发执行20次: 系统性能测试-测试结果 压力测试结果分析图 工作总结及展望 工作总结 礼品数据抓取 礼品知识库构建 礼品知识库知识获取 礼品相似度 礼品关联规则 礼品搜索 研究展望 礼品知识库的完善和噪声
文档评论(0)