基于关联矩阵和学习自动机电影研究.docVIP

基于关联矩阵和学习自动机电影研究.doc

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于关联矩阵和学习自动机电影研究

基于关联矩阵和学习自动机电影研究   摘要:随着技术的进步,用户的需求不断发生着变化,为特定用户推荐其感兴趣或对其有用的产品和服务已经成为一个挑战[1]。该文提出了一种关联矩阵与学习自动机相结合的协同过滤方法,提高预测和推荐的准确性。将关联矩阵引入到相关电影的推荐工作中,定量的计算出电影相关度,用学习自动机进一步优化关联矩阵使之能够更准确的揭示实际中的电影之间的关联,从而提高推荐的准确性。   关键词:协同过滤;关联矩阵;学习自动机   中图分类号:TP301文献标识码:A文章编号:1009-3044(2012)08-1721-02   随着Internet的不断发展,从网络资源中获取信息已成为人们获取信息的重要方式。由于在网络中的信息数量的爆炸性增长,用户很难能够选择其所感兴趣或对其有用的资源[2]。协同过滤[3]是个性化推荐技术之一,在研究和工业中一直都非常有前景。对历史类似用户群体使用协同过滤,对目标用户进行推荐[4]。但是,传统的协同过滤遇到一些限制从而影响其准确性。一个重要限制是数据稀疏问题。另一个重要限制是协同过滤只考虑用户或项目从而限制了推荐质量和协同过滤的适用性。   该文从用户和项目的属性为基础计算项目之间的关联矩阵,即项目的相似性计算机制,提出对稀疏用户项目矩阵中的空白元素的预测。实验研究表明[7],这个方法有助于有效地预测稀疏矩阵中空白的元素,再运用学习自动机机制来优化关联矩阵,使之更加与实际相符合,提高推荐的准确性。   1关联矩阵   给定一个用户集合U={用户1,用户2,...,用户m},一个项目集合T={项目1,项目2,...,项目n},用户项目矩阵表示为矩阵R=U×T,在矩阵R中的值为从1至5的正整数,若用户对项目没有评分,则R中的值为空,Ri,j表示用户i对项目j的评分。在网络中的用户和项目的数量是相当庞大的[5]。   每一个电影拥有数个类型,每个类型都是电影的属性,每一个属性都有一个初始特征值,用布尔值来构建这个特征值矩阵。通过电影类型相似度[7],得到一个电影关联矩阵。   对每一个用户,分析其对电影的评分进而来更新电影关联矩阵中电影之间的关联度。过程如下:首先,取出用户评过分的某部电影,与余下的n-1部电影比较,从而更新电影之间的关联度;之后,取出用户评过分的另一部电影,与余下的n-2部电影比较,继续更新电影之间的关联度;依次类推,从而完成该用户对电影关联矩阵的影响,接着,考虑其他用户,整个过程也是如上所述,从而形成最终的关联矩阵(ROF)。   更新策略为某个用户对两部电影的评分值差距小于等于1分时,加强这两部电影的关联度,更新策略为某个用户对两部电影的评分值差距小于等于1分时,加强这两部电影的关联度,公式如下:   ROF( )   (2)   gradei和gradej表示用户对电影i和电影j的评分。最后对关联矩阵做平均处理,保证其为一个对称矩阵。   通过以上的处理每个电影和其他的电影都有一个关联度,从而避免了用户电影矩阵存在的稀疏性的问题,这里通过电影的关联度来对未评分的电影来进行预测。   2学习自动机   学习自动机系统具有一个行为集α={}一个行为的发生概率决定,在运行过程中,系统根据反馈所得的信息进行学习,调整行为的发生概率,从而自动适应周围的环境[6]。   之前方法得到的关联矩阵没有考虑用户及电影的差异性,该文运用了学习自动机来对之前的关联矩阵进行优化,所有的用户作为学习自动机的行为集合,初始化的行为选择概率为各用户所评分的电影个数与所用用户所评分的电影个数总和的比。每部电影有电影的被评分比率为对该电影评分的用户数目与所有用户数目的比。学习自动机通过初始化概率来选择用户,当某个用户被 选择时,根据其所评分的电影的相对评分比率,来进行电影的一个概率选择,即该用户对该电影的评分比除以该用户对所有电影的评分比率的总和。   通过以上的概率选择出某部电影,根据该用户对该电影的评分与所有用户对该电影评分的平均分的比较来判断是惩罚还是奖励。当该用户对该电影的评分与所有用户对该电影评分的平均分的差值小于等于1时,用公式(1)增强所选择的电影与该用户所评分的其他电影之间的关联度,并认为应该奖励,增加该用户被选择的概率,公式如下   (3)   当该用户对该电影的评分与所有用户对该电影评分的平均分的差值大于等于3时,用公式(2)减弱所选择的电影与该用户所评分的其他电影之间的关联度,并认为应该惩罚,降低该用户被选择的概率,公式如下   pk=   3实验结果   为了测试提出方法的效率,使用MovieLens电影数据集来进行实验。数据集共有五个测试部分,记为Ⅰ、Ⅱ、Ⅲ、Ⅳ、Ⅴ,选择的阈值为20000,50000,100000。这里使用平

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档