- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
关于农资产品个性化推荐研究
关于农资产品个性化推荐研究
【摘要】文章首先介绍了农资产品个性化推荐的背景和意义,然后介绍关于农资产品进行个性化推荐的技术,如粗糙集技术和ROCK聚类算法等,再然后对农资产品个性化推荐系统进行详细的描述,最后对不足进行了总结。
【关键词】个性化推荐;商品关键属性;ROCK聚类算法;粗糙集
1.背景
现如今在茫茫如海的网络信息中去寻找对自己有用的信息已经越来越难,为此个性化推荐技术应运而生,它能够针对每一位用户提供专属于他自己的推荐信息,尤其是在商业上应用广泛,时至今日几乎所有大型的电子商务网站,如亚马逊、京东商城和当当网等,都推出了个性化推荐服务[1],他们往往通过用户的注册信息、浏览记录和消费记录对每位用户进行个性化推荐[2,3]。然而针对农村市场的电子商务网站现在还不多,对农村用户的个性化推荐更是寥寥无几,中国到目前为止还是一个农业大国,农村市场有着无限的潜力可以挖掘,纵然消费能力弱和物流条件差等可能是阻碍这一进程的原因,但是随着国家对乡镇农业的持续大力支持,农业信息化的前景将更加广阔,而针对农村市场建立相应的电子商务网站并对农村用户进行个性化推荐势必也将提上日程。农资信息网通过传播农业技术知识、宣传农业政策法规和提供农资产品的电子商务平台等服务将成为服务农民、开拓农村市场的先行者[4]。在网站建设中如果将针对农村群体的个性化推荐技术加入其中,那么网站将会为那些知识较缺乏、信息较闭塞的广大农村用户提供更贴切、更周到的服务,将更符合用户需求的信息和产品推荐给他们。
农村市场的农资用户与普通的电子商务网站用户在推荐模式上有着很大的区别。首先,普通的电子商务网站用户是依照自己的兴趣爱好、生活习惯和需求去浏览网页并进行购物,所以针对他们的个性化推荐往往以兴趣爱好作为首要因素;然而,对于农资用户而言,兴趣爱好并不是左右他们购买商品的原因,能否满足他们的需求,也就是说东西好不好、实不实用才是影响其个性化推荐的主因,因此销售后的回访、评价往往对日后的推荐影响重大,然而由于农资产品的特色性质,???的验证期往往很长,少则三个月多则一年,因此针对农资用户建立推荐模型则需要时以年计的数据库为依托,不可能迅速投入商业应用,所以应该利用线下销售中得到的大量不完备信息进行整理,找到影响推荐的关键信息,才能使网站推荐系统投入商用[5]。第二,商品对用户的吸引力往往不在于其本身所有的属性,而在于该商品包含了某种或多种关键属性,是这些关键属性让用户了那些商品,所有我们将运用粗糙集技术去处理那些大量的不完备信息并简约出商品的关键属性。第三,由农民朋友日常的消费习惯得知,他们购买的农资产品时往往会借鉴周围朋友的购买经验,也就是说相同人群的人购买的商品也大致相同,所以ROCK聚类算法在这方面能够提供很好的帮助,因为ROCK算法提出了邻居概念,即:如果两个消费者不仅它们本身相似,而且它们的邻居也相似,则这两个消费者很可能属于同一个簇。
本文针对农资产品个性化推荐的特殊性建立了个性化推荐系统模型。
2.ROCK算法
ROCK(Robust Clustering Using Links)算法是一种凝聚的层次聚类算法,是由Guha等人在1999年提出的,适用于类别属性[6]。
对于具有分类属性的数据,传统的聚类算法一般采用距离函数来度量数据对象间的相异度。然而,实验表明这种距离度量方法对具有分类属性的数据不能得到好的聚类结果。而且绝大多数聚类算法只考虑点与点之间的相似性,因此在聚类的每一步,具有最大相似度的点被合并到同一个簇中这样很容易导致错误的合并。例如,有几个点来自两个显著不同的簇,而这几个点非常接近,那么根据上述的点与点之间的相似度,这两个显著不同的簇将被错误地合并在一起。为了避免这种情况,ROCK采取了更加周全的方法,也即引入了邻居的概念。如果两个点不仅它们本身相似,而且它们的邻居也相似,则这两个点可能属于同一个簇,因此被合并。
【定义1】邻居:两个点Pi,Pj,如果满足sim(Pi,Pj)≥A,则称Pi,Pj为邻居。其中,sim是一个相似性度量函数,A是由用户给定的阈值。sim可以是一个距离度量或者甚至是由领域专家提供的非形式化的度量,只要它能够标准化为0和1之间的值,而且这种值越大,相应的两点间的相似度越高。
【定义2】连接:link(Pi,Pj)为二数据点Pi,Pj的相同邻居数,值愈大表Pi,Pj同一簇的几率愈大。
【定义3】标准函数:
在聚类过程中,我们需要最大化簇内link(pq,pr)数量的同时最小化簇间link(pq,pr)的数量。此式子能够帮助我们找到簇内最多链接的同时尽量减少簇间链接数。其中:
ni为簇Ci中数据点的总数;
为Ci中预期的邻居总数;
文档评论(0)