淘宝商品评价属性分类研究.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
淘宝商品评价属性分类研究   摘 要: 设计了一个基于API技术的淘宝商品评价分类系统。利用淘宝开放平台提供的API接口获取商品评价信息,然后将这些评价信息按照质量、物流以及服务态度等属性分别分出好评和差评,通过对典型操作实例的理论分析和实验结果,验证了该方法的有效性。   关键词: 淘宝API;评价属性;评价分类   淘宝开放平台是一个综合性、商业性的开放平台[1]。TOP发布的API涵盖了商品、产品、类目、用户、交易、评价和物流等不同专业领域的开放接口。使用这些预先定义好的函数,可以更加方便、快捷地调用这些接口来完成一些有关处理工作。   淘宝网作为国内最大的电商网站,每月每天甚至每小时的交易量都是相当大的,而作为买家在淘宝网上购买商品之后,无论对商品满意与否,都可以通过淘宝网提供的商品评价系统对所购买的商品作出自己的评价,这就产生了大量的评价信息。这些评价对今后购买同种商品的买家可以产生重要的指导作用;评价信息里反映出的买家对商品比较关注的一些问题也为卖家不断改进商品提供了方向。   但是目前淘宝评价系统只是单纯地将买家的评价罗列在产品信息页面上,这些评价包含了买家对该商品在做工、款式、服务态度、发货速度和物流速度等相关评价属性的信息反馈,这对想查看该商品某种评价属性信息的买家和卖家带来了很大的困难。有些商品评价信息较少,可以通过逐条查看的方法来获取需要的信息。但是对于有几千条甚至上万条评价信息的商品来说,逐条查看必定会耗费大量的精力,也无法取得较好的效果。同时,淘宝提供的好评、中评和差评都是由买家人工选择的。有时候买家对商品并不很满意,但是由于卖家服务态度较好等原因也给出了好评;而有些差评则是因为卖家服务态度不好或者物流送货不及时等原因,但是商品本身质量并没有问题,这就对信息获取造成了误差。针对上面的问题设计并实现的淘宝商品评价属性分类系统,利用淘宝开放平台提供的API技术获取相关评价信息,然后按质量、物流和服务这3项关注度最高的属性将评价信息进行分类,并对每种属性按评价内容情感倾向度分别判别出好评和差评。本系统实现了买家在淘宝网意向商品的大量评价中筛选出自己希望了解的关于商品某属性的评价信息,同时也帮助卖家了解在售商品各个属性的买家反馈信息,更好地改进商品。   1 相关工作   本系统通过评价API接口获取商品评价信息作为基本的数据来源。系统中的商品评价主要分为两类。(1)按照商品属性进行分类。商品的属性特征都是由它的特征词来表现的,主要是能够定义属性的名词或者名词短语。本系统将评价信息按照质量、服务、物流3个属性进行分类。(2)按照情感倾向度进行分类。本系统提取评价信息中的情感词并按照一定规则组成短语模型与事先建立好的短语模型情感倾向库进行匹配,开发了一种计算情感倾向度的算法,按照此算法将商品的每个属性都分为了好评和差评。   2 系统的具体设计   2.1 评价API获取评价内容   该模块主要是获取评价文本和文本转存两个功能。使用API要先创建一个ITopClient对象,向接口地址/router/rest发起连接请求,请求成功后,建立TraderatesGetRequest评价文本查询请求对象,设置请求的字段和参数,再建立TraderatesGetResponse对象接收返回的数据,把获得评价文本内容保存到文本文件。格式是Json字符串。   2.2 建立商品属性特征词库   商品特征词的抽取主要有分词标注和按规则抽取特征词两个步骤。   (1)要抽取特征词,必须要用分词工具先把句子分成词语,然后对词性进行标注,才能分析每个词语的意义。使用SHARPICTCLAS分词工具分词标注,例如:衣服/n很/d/a!/w很/d合身/a!/w店家/n服务/vn态度/n也/d很/d好/a,/w虽然/c中间/f出/v了/ul点/q小/a插曲/n,/w但是/c很/d快/a都/d给/v解决/v了/y。/w店家/n工作/vn相当/d给/p力/n。/w快递/vn也/d很/d给/p力/n!/w赞/vg一个/m!/w   (2)分词标注之后,还要过滤掉一些没有意义或者不是想要的词。首先就是根据词性过滤。例如店家/n服务/vn态度/n也/d很/d好/a,这个是标注完毕的句子,看到“服务态度”这个名词短语其实就是商品服务的一个特征,也可以简化成“态度”。前面提过,只有名词或名词短语才能表示商品的属性特征,所以可以把名词短语以外的非名词词语过滤掉,上面的例子过滤后就是“店家/n服务/vn态度/n”,其他词性就不要了。然后再根据手工收集的一些无意义词文件,过滤掉无意义词,最后去除词性标注,合并同类项,再利用Apriori算法中的频繁项定义,过滤掉噪音词,属性特征词库就建立了[2]。将需要分类的评价信息分词标注之后与属性特征词库进行匹配,实现

文档评论(0)

我思故我在 + 关注
实名认证
文档贡献者

部分用户下载打不开,可能是因为word版本过低,用wps打开,然后另存为一个新的,就可以用word打开了

1亿VIP精品文档

相关文档