- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
I
I
摘 要
摘 要
随着电子商务的兴起,网络客户评论也必然会成为人们购买产品和商家改进自身服 务的重要参考,但是如何从海量评论中挖掘出有用信息是一项具有挑战性的工作。产品 特征挖掘作为网络评论挖掘的关键技术之一,已成为网络评论挖掘领域的一个重要研究 方向。本文给出了一种面向网络评论的产品特征和极性词挖掘方法,目的在于从大量网 络客户评论中对产品特征和极性词进行自动化地抽取。
本文基于关联规则算法和属性共现度对网络评论中的产品特征进行挖掘,在获取的 产品特征集合的基础上,通过句法分析器来提取极性词。主要工作如下:
在创建关联规则事务文件过程中建立常用产品特征列表,尽可能地减少中文分词工 具对挖掘结果的影响,通过关联规则算法获取名词和名词短语作为候选产品特征集合, 并将互信息引入到候选特征的剪枝中,对互信息的计算公式进行了改进,计算候选特征 与区分符的互信息值,过滤不满足阈值的候选特征;然后通过极性词挖掘非频繁特征对 关联规则算法进行补充,得到更加全面和准确的产品特征。
在挖掘得到的产品特征集合的基础上,利用句法分析器形成句法分析树,提取存在 SBV 依存关系的词对,通过三步剪枝获得最终的极性词集合。
本文从大型中文购物网站上选取评论语料,对提出的产品特征和极性词挖掘方法分 别进行了验证,实验结果证明了本文方法的有效性。
关键词 关联规则 属性共现 互信息 剪枝 句法分析器
II
II
Abstract
Abstract
With the development of e-commerce, network reviews will inevitably become an important reference for people to buy products and businesses to improve their service, but how to dig out useful information from the mass reviews is a challenging work. Product features mining as one of the key technologies of network reviews mining has become an important research direction in network reviews mining area. This paper proposees a network reviews-oriented product features and opinion words mining method, the purpose is to extract the product features in a large number of network reviews automatically.
This paper mines the product features and opinion words based on association rules algorithm and the degree of property co-occurrence in the network reviews, and on the basis of product feature set extracts the opinion words by the syntactic parser. The main work is as follow:
Creating the common product features list in the process of creating association rules transaction file to minimize the impact of the Chinese fragment tool for mining results, extracting the nouns and noun phrases as the product feature set though the association rules algorithm, and introducing the PMI into the candidate features pruning, we improve the PMI formula to calculate the PMI value between the candidate features and specifiers, filtering the candidate features which do not meet the
您可能关注的文档
- 抗氧化剂对冷冻人颗粒脂肪组织的保护作用-临床医学(外科学)专业毕业论文.docx
- 面向自主创新的企业技术战略作用机理及决策研究-技术经济及管理专业毕业论文.docx
- 绵果荠、卷果涩荠CBF基因的克隆及分析-生物化学与分子生物学专业毕业论文.docx
- 美国PBL教学模式及在我国高校研究生教学中的应用研究-比较教育学专业毕业论文.docx
- 煤矿瓦斯智能传感器的应用研究-控制理论与控制工程专业毕业论文.docx
- 枯草芽孢杆菌胞苷生产菌株的构建-生物化学与分子生物学专业毕业论文.docx
- 面向服务的系统可视化开发系统的研究与实现-计算机软件与理论专业毕业论文.docx
- 煤矸石应用于道路底基层的路用性能试验研究-道路与铁道工程专业毕业论文.docx
- 洛阳汉画像砖艺术分析-考古学专业毕业论文.docx
- 抗抑菌洗涤剂的研究与制备-化学工程专业毕业论文.docx
- 煤粉着火炉的设计与实验研究-热能工程专业毕业论文.docx
- 美国IBM红皮书(电子版)成功推广的原因-出版学专业毕业论文.docx
- 面向服务的党务电子政务平台的设计与实现-软件工程专业毕业论文.docx
- 面向中小企业的员工考勤和培训管理信息系统的研究与设计 软件工程专业毕业论文.docx
- 考虑各向异性的复合地基静动力特性研究-岩土工程专业毕业论文.docx
- 罗定职业技术学院数字微格教学系统的设计与实现-软件工程专业毕业论文.docx
- 面向电子采购的多属性拍卖理论研究-管理科学与工程专业毕业论文.docx
- 旅游博客的多模态语篇研究-外国语言学及应用语言学专业毕业论文.docx
- 民国国语运动背景下中华书局出版传播活动研究-传播学专业毕业论文.docx
- 棉花黄萎病蛋白质组学研究及GbCHI基因功能分析-遗传学专业毕业论文.docx
最近下载
- 蓝海华腾VA-H系列伺服驱动器 用户手册2.0.pdf
- 国家法定41种传染病大全(就诊科室、传播途径、病原体、检测方法等)及防护措施.doc VIP
- GB50877-2014 防火卷帘、防火门、防火窗施工及收规范.docx VIP
- T_CECWA 2001-2023 钢结构焊接工艺评定标准.docx
- 8.铁路工程预算定额 路基工程宣贯讲义.ppt VIP
- 2024年四川宜宾五粮液股份有限公司招聘笔试真题.docx VIP
- 医疗废物管理条例.pptx VIP
- 2025年辽宁省电力行业十五五发展规划研究.docx
- 国标GB_T 43388-2023《家用汽车产品严重安全性能故障判断指南》实践.pdf VIP
- 厂房租赁合同.doc VIP
文档评论(0)