- 1
- 0
- 约3.21万字
- 约 43页
- 2019-05-08 发布于上海
- 举报
摘 要
摘 要
产品评论挖掘就是从用户发表的评论中挖掘出产品特征、用户观点,并判断观点极 性,为生产、营销商家和潜在的用户提供参考。通过对提取出的产品特征进行分析,发 现用户对产品特征粒度的关注是不同的,本文针对这一问题进行了研究,主要工作如下:
利用基于索引的标签路径的方法找到数据区路径,抽取产品说明书和原始评论。定 义标注细则,完成原始评论的人工标注,为后续研究准备基础数据。
给出了基于特征粒度树获得产品特征粒度关系的方法。由于单个说明文档中的特征 分类效果不好,本文利用改进的相似度公式判断来自不同说明文档特征记录的相似性, 相似度公式的改进使得特征记录相似性判断的准确性有了较大提高;基于相似特征记录 将特征组进行重组,根据新的特征组集合建立特征粒度树;由于特征记录来源于同一型 号的产品,其特征覆盖不完全,本文抽取了多种类型产品的说明文档,用于完善粒度树, 增加特征粒度树的广泛适用性;根据相似度计算和《同义词词林》判断从产品评论中抽 取的特征与特征粒度树中结点的相似性,将产品特征在特征粒度树中进行定位,从而获 得产品特征之间的粒度关系。
实验结果表明本文改进的相似度公式提高了相似判断的准确性,也验证了基于特征 粒度树获得产品特征粒度关系方法的有效性和本文建立的特征粒度树的实用性。
关键词 评论挖掘 特征粒度 特征粒度树 特征抽取 相似度计算
I
Abstract
Abstract
With the explosive growth of the network information, how to find useful information from it comes to a hot research focus. Mining product reviews is to extract the product features, users’ attitudes and judge the emotional polarity, in order to offer reference information for potential users and merchants. However, after analyzing the extracted product features, we find that the granularities of product features which users concern are different. So the paper studies this problem, and the main work as follows:
Using the method of label path basin on index, this study finds the path of data area, and extracts the product manual as well as original product reviews. Then define the label rules and mark reviews artificially, preparing the adequate data for follow-up.
This paper proposes a method about how to get the granularity distribution of features based on feature-granularity tree. Firstly, because the category of the feature-groups from single specification file is indistinct, we judge the similarity of feature-records from from different specification files by using an improved formula of similarity calculation which improves the precision of judging the similarity of feature-records. Secondly, restructure the feature-groups based on similar feature-records. After these, a feature-granularity tree is built according to the new feature-groups. Secondly, restructure the fe
您可能关注的文档
- 猕猴桃脂氧合酶基因家族的功能解析及其调控-果树学专业毕业论文.docx
- 面向中小企业的供应链管理系统研究与实现-机械电子工程专业毕业论文.docx
- 毛冬青滴丸的药学研究-中药学专业毕业论文.docx
- 绿色壁垒对山东省农产品出口的影响及对策-国际贸易专业毕业论文.docx
- 论中学物理教学的探究理念-课程与教学论专业毕业论文.docx
- 民初外交舞台上的王宠惠——以任外交总长与出席华盛顿会议为中心的讨论-中国近现代史专业毕业论文.docx
- 面向订单制造业的供应链绩效评价的研究与应用-机械电子工程专业毕业论文.docx
- 美国电视剧在中国的跨文化传播研究-英语语言文学专业毕业论文.docx
- 脉冲电流烧结氮化铝透明陶瓷-材料学专业毕业论文.docx
- 黄颡鱼性腺发育及周年变化的研究-水产养殖专业毕业论文.docx
- 宣贯培训(2026年)《NYT 4512-2025 非洲菊疫病抗性鉴定技术规程》.pptx
- 宣贯培训(2026年)《NYT 4514-2025木薯副产物综合利用导则》.pptx
- 宣贯培训(2026年)《NYT 4513-2025木薯全程机械化生产技术规范》.pptx
- 宣贯培训(2026年)《NYT 4470-2025全株玉米青贮质量分级》.pptx
- 宣贯培训(2026年)《NYT 4468-2025玉米供需平衡表编制规范》.pptx
- 宣贯培训(2026年)《NYT 4469-2025全株玉米青贮质量评定 综合指数法》.pptx
- 宣贯培训(2026年)《NYT 4474-2025东北地区玉米-大豆轮作生产技术规程》.pptx
- 宣贯培训(2026年)《NYT 4472-2025玉米耐盐碱鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4473-2025玉米抗旱性鉴定评价技术规程》.pptx
- 宣贯培训(2026年)《NYT 4478-2025甘薯收获技术规程》.pptx
最近下载
- 基于51单片机的智能宠物养殖箱系统设计.docx VIP
- 天津忠旺铝业有限公司铝及铝合金建设项目环境影响评测报告.pdf VIP
- 股权投资基金合伙协议模板(双GP+委托管理模式) (最全).doc VIP
- 【羿科安全 内部培训】07 足部防护培训.pptx VIP
- 麻黄碱脱氧后处理结晶工艺的论述(第一部分).pdf VIP
- 七年级语文下册第二单元5黄河颂省公开课一等奖新课获奖课件.pptx
- 最新《黄河颂》公开课一等奖课件 .pptx VIP
- 智能家居检测系统.docx
- (81格)舒尔特方格-儿童注意力训练(每日一练,共27份).docx VIP
- (81格)舒尔特方格-儿童注意力训练(每日一练,共20份).docx VIP
原创力文档

文档评论(0)