基于属性特性算法商品系统模型.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于属性特性算法商品系统模型

基于属性特性算法商品系统模型   推荐系统是根据用户的兴趣爱好推荐符合用户兴趣的对象,也称为个性化推荐系统。商品推荐系统依据收集到的顾客的信息和交易记录等有关数据,查找具有某些特性的顾客与他们购买的商品间存在的关联规则,大致确定顾客喜欢的商品的种类范围,向客户推荐与客户购买的商品存在一定关联的其他商品,既为客户购买商品提供了方便,又可提高网站的销售量。近年来,随着人民生活水平的提高和网络购物的发展,各购物网站中商品的数量和种类都大大增加,为了方便顾客在海量的商品中尽快寻找到所需要的商品,可靠高效的商品推荐系统必不可少。   在粗糙集相关理论中,知识被定义为对论域的划分模式,知识具有颗粒性,称为信息粒度或知识粒度,简称粒度。由于每个粒度都带有一定的属性,这使粒度间存在相互包含的关系,而粒度存在的关联规则在其包含粒度中也同样存在,例如,当存在所有男人都喜欢篮球的时候,就可以推导出中国男人都喜欢篮球。依据粒度间属性的特性编写的算法?Q为属性特性算法,该算法通过组织相关包含数组等方法,避免在某个粒度的包含粒度上挖掘相同的粒关联规则,达到节省时间,提高挖掘效率的目的。   将属性特性算法应用到商品推荐系统中,其优点有:   一般顾客在超市购物时,往往不会只购买一种商品,这种现象在网络购物平台也同样存在。但是,现有推荐系统大多根据顾客搜索的关键字提供同一类型的商品。由于单个顾客面对不同商家的同一类商品时往往只会选择其中一家的商品,这样对购物网站的交易量提高幅度有限。属性特性算法基于粒计算,关注的重点是带有相同属性的粒度间存在的关联规则,因此不限制推荐商品的种类,其挖掘结果涉及多种商品,这样在给顾客更多选择的同时,有利于提高购物网站的交易数量和交易额。   传统算法虽然可以较准确地推测出某位客户感兴趣的商品,但是在大数据背景下,当数据的规模增大后,传统算法所需的时间消耗随之增加,这大大影响了系统的运行速度。属性特性算法利用某粒度存在的关联规则在其包含粒度中同样存在的特性,通过减少判断关联规则的次数的方法,提高每次比较中输出关联规则的数量,从而减少系统在运行中的时间消耗。在有关数据集的实验表明,在同等要求下,属性特性算法可以有效提高挖掘效率,有利于在数据量增加的情况下,降低系统反应时间,提升系统性能。   一、属性特性算法基本原理   在实际应用中,往往根据具体要求将信息按照所含属性的多少划分为不同的粒度,这使各个粒度间由于所含属性的多少而相互包含,例如粒度就包含∧等粒度。   源覆盖度、目标覆盖度、源置信度和目标置信度是衡量粒关联规则强度的4个度量标准。在粒计算中,每个大小不一的粒度都带有一定数量的属性和属性值,这些属性和属性值使部分粒度存在着一定的包含关系。当源覆盖度为100%,而目标覆盖度也为100%的时候,称为完全匹配。在完全匹配的情况下,一个粒度与其他粒度间存在的所有关联规则,在它的所有的包含项中同样存在,例如,当100%的美国人(粒度)喜欢100%的白色商品(粒度)的时候,可以得出100%的美国已婚人士(粒度∧)喜欢100%的白色美国产商品(粒度∧。   利用粒度属性的特性设计属性特性算法,将粒度的包含项放入该粒度的包含数组中,当挖掘到粒度A和粒度B建存在粒关联规则时,采用遍历的方法直接输出粒度A的包含粒度粒度与粒度B的包含粒度间存在同样的粒关联规则,这样就节省了在其包含粒度上判断是否存在粒关联规则的时间,提高了挖掘的时间效率,具体做法如下:   为每个粒度开辟有关包含数组,该粒度为该数组的第1个元素;   在属性比自身不多1的粒度中为每个粒度查找其包含粒度,并放入其包含数组中,形成该粒度的初步包含数组;   从粒度的初步包含数组第2个元素(第1个子粒度)开始,查找其初步包含数组里的粒度,把它们放入父粒度的包含数组中,形成完全包含数组,其过程如图2所示;   按要求两个数据集中的粒度相互比较,如果存在关联规则,则输出两个粒度完全包含数组中的所有关联规则。   算法流程图如图2所示,当发现两个粒度间存在粒关联规则时,属性特性算法一次可以输出多条粒关联规则,与一般采用的逐个比较的方法相比,可以节省在某粒度的包含粒度上挖掘粒关联规则的时间,提高了挖掘效率。   二、属性特性算法的应用   本设计基于特点相似的人感兴趣的商品范围也相似的理念,将粒计算的思想和属性特性算法应用到商品推荐系统里,在把数据库中的用户信息和商品信息根据包含属性的多少划分为大小不一的粒度的基础上,根据近期的购买情况,结合粒度相关设定的源置信度和目标置信度等相关要素,利用属性特性算法查找相关粒度间的粒关联规则,快速从海量数据中挖掘出顾客特点与所购买商品间的联系,指导系统向特定顾客推荐特定范围的商品。   三、商品推荐系统模型设计

文档评论(0)

erterye + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档