基于MKL-SVM网络购物评论分类方法.docVIP

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于MKL-SVM网络购物评论分类方法

基于MKL-SVM网络购物评论分类方法   摘 要: 购物网站在线评论系统收集了大量的顾客评价。支持向量机(SVM)是一种有效的文本分类方法,可以用于跟踪和管理顾客意见,但是SVM存在训练收敛速度慢,分类精度难以提高等缺点。文章提出利用异质核函数性的不同特性,解决支持向量机(SVM)数据泛化学习能力弱的问题,提高SVM的分类精度,通过对顾客购物评论进行分类,解决购物网站海量顾客评论分析的问题,帮助企业及时进行顾客反馈,提升服务水平。   关键词: 网络购物评论; 文本分类; SVM; 多核学习   中图分类号:F406.2 文献标识码:A 文章编号:1006-8228(2012)04-43-03   A classification method of online reviews based on MKL-SVM   Hu Han   (Dujiangyan north street elementary school experiment foreign language school, Dujiangyan, Sichuan 610054, China)   Abstract: An online shopping website accumulates a large number of customer reviews for goods and enterprise services. Support Vector Machine (SVM) is an efficient classification method and can be used to track and manage customer reviews. But SVM has some weaknesses, for example, its slow speed of training convergence and uneasy raise of classification accuracy. The author presents the use of heterogeneous nuclear function of different characteristics, which may resolve SVM’s problem of weak generalization ability to learn and improve SVM classification accuracy. Through classification of online customer reviews, shopping sites may resolve the issues of critical analysis of mass data, and effectively help enterprises to improve service levels.   Key words: customer review; text classification; SVM; multiple kernel learning   0 引言   购物网站都建立有顾客评论系统,收集顾客对于商品及网站服务的体验感受。由于购物评论表达形式繁杂、内容随意、句型多样,给企业有效跟踪和管理用户评论意见,带来了很大的难度。   文本分类(text categorization)应用分类函数或分类模型,把文本映射到多个类别中的某一类,使检索或查询的速度更快,准确率更高。文本分类在自然语言处理与理解、信息组织与管理、内容信息过滤等领域有着广泛的应用。主要分类方法有:贝叶斯、决策树、支持向量机(Support Vector Machines, SVM)、神经网络、遗传算法等??其中SVM通过分隔面模式摆脱了样本分布、冗余特征以及过度拟合等因素的影响,具有很好的泛化学习能力[1]。但是SVM存在训练收敛速度慢,分类精度难以提高等缺点。   核函数是SVM解决非线性问题的方法,受限于单个核函数性能,使得SVM泛化学习能力有限,分类精度难以提升。多核学习(Multiple Kernel Learning,MKL)利用对同质(homogeneous)或异质(heterogeneous)核函数优化整合,提高了SVM的学习能力和泛化性能。在处理大量异质数据时,MKL具有很好的灵活性,且分类结果更清晰,便于解决现实应用问题[2],但MKL涉及较多的相关参数的优化。对MKL研究目前主要集中在图像识别领域[3,4]。本文通过校准算法确定MKL异质核函数的优化权系数和核参数,建立基于多核学习的支持向量机(Multiple Kernel Learning SVM,

文档评论(0)

bokegood + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档