- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
网络文本评论中产品特征抽取总结
网络文本评论中产品特征抽取总结
〔摘要〕随着Web2.0技术和电子商务的飞速发展,越来越多的用户通过互联网分享产品的使用体验和表达喜恶的观点,如何有效地从评论文本中抽取产品特征是产品意见挖掘方向所亟需解决的问题。本文从产品特征频繁项、特征-意见共现关系、模型训练和显隐式特征匹配四个方面介绍产品特征抽取工作在国内外的研究进展并指出其各自的优势和不足,最后列出产品特征抽取在今后的研究方向。
〔关键词〕在线评论;意见挖掘;特征抽取;文本分析
DOI:10.3969/j.issn.1008-0821.2016.08.031
〔中图分类号〕TP3911〔文献标识码〕A〔文章编号〕1008-0821(2016)08-0168-06
〔Abstract〕With the rapid development of Web20 technology and electronic commerce,more and more customers participate in the Internet,share product experience and express likes or dislikes about product.It is a challenge to extract product feature from customer reviews effectively in the product opinion mining field.Firstly,this paper introduced the research progress of extracting product feature from frequency,co-occurrence,modeling and implicit feature mapping both at home and abroad.Secondly,it presented their strength and limitation respectively.Finally,it enumerated some research interest about this task.
〔Key words〕online review;opinion mining;feature extraction;text analysis
近年来,随着Web20技术的发展,大量的在线产品评论文本不断涌现,对于有购买意向的潜在消费者来说,手工从产品评论中总结归纳出消费者对已购产品所持的褒贬态度是不现实的,尤其是意见相左的产品评论更让他们感到无所适从;对于生产厂家来说,从产品评论中了解消费者对产品整体或某一特征的意见,对企业竞争情报分析和后期产品质量的改进都大有裨益,因而对于评论中用户表达意见的研究具有重要意义。
随着物质文化生活水平的提高,人们对消费品需求日趋多元化、个性化,他们不再满足于产品的整体性能优劣,而是根据个人的消费喜好来关注产品的某一部件或属性的性能,较多关注产品局部的评论内容,因此如何准确全面抽取评论文本中所蕴含的产品特征信息是研究者所面临的重要问题。本文站在技术实现的角度从四个方面综述文本评论中产品特征抽取技术在国内外的研究进展及各自的优势和不足,最后指出产品特征抽取技术所面临的挑战和今后的发展方向。
1基于频繁项的特征抽取
该方法通常对评论语料中出现频率较高的名词或名词短语应用约束条件而抽取出来作为产品特征。产品特征词通常由名词、形容词、副词或动词组成。Liu[1]认为60%~70%的产品特征词是显式名词,由于人们习惯在评论中经常使用,因此产品的部件或属性常由经常出现的这类名词表示,同时还需要对频繁出现的名词中的非产品特征词进行过滤。
Hu[2]最先提出的基于特征摘要(Feature-based Summarization)算法。他首先将产品评论中频繁出现的名词短语作为候选种子词,然后通过密实度修剪(Compactness Pruning)去掉那些未按照指定顺序在一起出现的无意义词以及冗余修剪(Redundancy Pruning)去掉未能表示产品特征的单个词,比如手机产品评论中的“时间”一词,只有在“待机时间”或“通话时间”的名词短语中才表示手机产品属性,单独出现则毫无意义,所以就把它从候选种子词中去掉。随后Popescu[3]基于如下假设:共现的次数越多的两个词,则它们之间的关联度越高,因此Popescu提出点互信息(Point-wise Mutual Information,PMI)方法比Hu的算法提高了22%的准确率,但是召回率降低了3%。Ku[4]利用TF*IDF从文档和段落级别来判断某词对产品特征的
您可能关注的文档
- 绵羊Toll样受体7基因多态性剖析.doc
- 绵羊不同养殖方式效益剖析及建议.doc
- 绵阳大汉投资集团有限公司渠道管理剖析.doc
- 绵阳市中心医院儿内科PICU死亡病例剖析.doc
- 绵阳市固体废弃物产生及污染防治状况剖析.doc
- 绵阳市国有农场生态化发展战略剖析.doc
- 绵阳市志愿服务长效机制建设剖析.doc
- 绵阳机场冬季连续浓雾天气成因及特征剖析.doc
- 绵阳房地产市场价格区域剖析.doc
- 综合ICU医院感染剖析及护理对策.doc
- 广东省东莞市2024-2025学年八年级上学期生物期中试题(解析版).pdf
- 非遗剪纸文创产品开发经理岗位招聘考试试卷及答案.doc
- 广东省东莞市2024-2025学年高二上学期期末教学质量检查数学试题.pdf
- 体育安全理论课件图片素材.ppt
- 3.1 公民基本权利 课件-2025-2026学年道德与法治八年级下册 统编版 .pptx
- 广东省潮州市湘桥区城南实验中学等校2024-2025学年八年级上学期期中地理试题(解析版).pdf
- 大数据运维工程师岗位招聘考试试卷及答案.doc
- 广东省深圳市福田区八校2026届数学八年级第一学期期末教学质量检测模拟试题含解析.doc
- 广东省潮州市湘桥区城基初级中学2024-2025学年八年级上学期11月期中考试数学试题(解析版).pdf
- 广东省潮州市湘桥区城西中学2024-2025学年八年级上学期期中地理试题(解析版).pdf
最近下载
- 2022-2023学年四川省成都市龙泉驿区六年级(上)期末数学试卷(含答案).pdf VIP
- 区文联党组书记2025年度民主生活会个人对照检查材料(五个带头).docx VIP
- 县水务局副局长2025年度民主生活会个人对照检查材料(五个带头).docx VIP
- 2023年福建中医药大学中医学《药理学》科目期末试卷A(有答案).docx VIP
- 重庆市九龙坡区2024-2025学年六年级上学期期末考试数学试题.docx VIP
- 2024-2025学年广东省江门市高一(上)期末语文试卷(含相信答案解析).docx
- 2024年中考物理复习:力学综合问题 压轴题训练(含答案).pdf VIP
- 医院科研及学术会议管理规定.doc VIP
- 2023年清华大学校史知识竞赛试题(附答案).pdf VIP
- 2023年福建中医药大学临床医学《药理学》科目期末试卷A(有答案).docx VIP
原创力文档


文档评论(0)