基于概率分类模型的个性化推荐算法研究-计算机软件与理论专业论文.docxVIP

下载本文档

7
0
约5.37万字
约 71页
2019-02-20 发布于上海
举报
版权申诉

基于概率分类模型的个性化推荐算法研究-计算机软件与理论专业论文.docx

1、原创力文档（book118）网站文档一经付费（服务费），不意味着购买了该文档的版权，仅供个人/单位学习、研究之用，不得用于商业用途，未经授权，严禁复制、发行、汇编、翻译或者网络传播等，侵权必究。。
2、本站所有内容均由合作方或网友上传，本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺！文档内容仅供研究参考，付费前请自行鉴别。如您付费，意味着您自己接受本站规则且自行承担风险，本站不退款、不进行额外附加服务；查看《如何避免下载的几个坑》。如果您已付费下载过本站文档，您可以点击这里二次下载。
3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等，请点击“版权申诉”（推荐），也可以打举报电话：400-050-0827(电话支持时间：9:00-18:30)。
4、该文档为VIP文档，如果想要下载，成为VIP会员后，下载免费。
5、成为VIP后，下载本文档将扣除1次下载权益。下载后，不支持退款、换文档。如有疑问请联系我们。
6、成为VIP后，您将拥有八大权益，权益包括：VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
7、VIP文档为合作方或网友上传，每下载1次，网站将根据用户上传文档的质量评分、类型等，对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档

重庆大学硕重庆大学硕士学位论文目录 PAGE PAGE IV 目录中文摘要I 英文摘要 II 1 绪论 1 1.1 研究背景 1 1.1.1 问题提出 1 1.1.2 研究意义 2 1.2 个性化推荐系统应用及研究现状 3 1.2.1 应用现状 3 1.2.2 研究现状 4 1.2.3 研究问题及挑战 6 1.3 内容及组织结构 7 2 推荐系统及算法概述 9 2.1 个性化推荐系统框架概述 9 2.2 推荐技术分类及比较 12 2.2.1 推荐技术分类 12 2.2.2 推荐技术比较 13 2.3 协同过滤推荐算法 14 2.3.1 基于近邻的协同过滤算法 16 2.3.2 基于模型的协同过滤算法 20 2.3.3 基于近邻和基于模型的算法比较 22 2.4 本章小结 23 3 基于概率分类的个性化推荐模型 24 3.1 概率分类模型表示 24 3.2 用户信息及对象信息建模 26 3.2.1 分类变量处理 27 3.2.2 连续变量处理 28 3.3 用户评分信息及上下文信息建模 28 3.3.1 用户评分信息处理 28 3.3.2 时间上下文信息处理 30 3.4 本章小结 31 4 概率分类模型建立与求解 33 HYPERLINK \l _TOC_250001 4.1 基于 Logistic 的概率分类模型建立 33 4.1.1 参数估计 34 HYPERLINK \l _TOC_250000 4.1.2 多项 Logistic 分类模型 35 4.2 最大熵概率分类模型建立 35 4.2.1 约束条件建模 36 4.3 算法流程 37 4.4 本章小结 39 5 实验设计与分析 40 5.1 实验数据集及评价指标 40 5.2 实验设计 43 5.3 实验结果及分析 44 5.4 本章小结 47 6 总结与展望 48 6.1 文章总结 48 6.2 展望 49 致谢 50 参考文献 51 附录 55 A. 作者在攻读学位期间发表的论文目录 55 B. 作者在攻读学位期间取得的科研成果目录 55 重庆大学重庆大学硕士学位论文 1 绪论 PAGE PAGE 10 1 绪论 1.1 研究背景问题提出据中国互联网络信息中心发布的《互联网发展信息与动态》显示，到 2013 年底，我国网民人数为 6.18 亿，互联网的飞速发展及提倡个性化为主要特点的 web2.0 技术的兴起，用户可以在网络上自由分享自己的想法、知识，互联网上的内容呈指数增长；移动互联网的发展极大加快了互联网上内容的增长速度。互联网不断的扩张，庞大的网民群体成为在线商家的潜在客户群，这极大推进了电商发展进程，电商平台阿里巴巴在其 2013 年的“双十一”活动中，日交易总额达 350 亿元，超过内地日均零售总额的一半。以淘宝、亚马逊、当当、京东等为代表电子商务网站将大量的商品搬上互联网，呈现到每一个用户面前。据统计，仅当当网一家的在线商品种类就达到 100 万。面对海量的网络信息、商品信息，用户不可能将所有的信息都浏览一遍。信息的增多，而用户无法有效获取需要的信息，这就是信息过载。信息过载情况下，用户只有有限的时间和精力处理小部分信息，因此，绝大部分信息与用户是隔绝的，这部分信息就不能被充分利用。反过来，站在信息发布者的角度，如何有效的将自己的信息展现给用户？如今的互联网应用，尤其是电子商务网站，由于商品数量庞大，用户花费在浏览商品的时间有限，如何将自己的大量的商品精准的推荐给潜在购买客户，是在目前竞争日益激烈的电子商务时代提高自己的竞争力以及提高营业额的关键所在。无论从用户角度还是从信息提供者的角度，如何有效的从海量数据中提取用户感兴趣的信息，成为互联网时代的重要技术和研究课题。为了解决信息过载的问题，以百度、谷歌为代表的搜索引擎周期性的对互联网上的信息进行爬取、筛选（去重、分词、去停用词、消除噪音等），并按照一定的规则进行索引（倒排索引）、处理（连接关系计算等）和存储，然后被动的等待用户请求其感兴趣的信息，当搜索引擎收到用户的检索请求时，搜索引擎通过将用户提交的关键字同自己存储的索引信息进行相关性匹配，然后利用计算得到的相关度对检索到的信息进行排序，再将排过序的结果呈现给用户。搜索引擎的问题在于，首先，它根据用户给出的关键字进行搜索，而用户给出的关键字比较随意、简短，并不一定能够明确描述用的兴趣，比如，用户在搜索框中输入关键字 “苹果”，搜索引擎在没有其他上下文信息的情况下不知道用户需要的是苹果品牌的电子产品还是一种水果。其次，它只关心用户输入的关键字，用相同的关键字进行的检索