- 16
- 0
- 约1.2千字
- 约 19页
- 2018-09-04 发布于河北
- 举报
意见挖掘
基于数据挖掘技术的网络商品在线评论意见倾向性分析研究 姜瑜斐 李真真 问题的提出 问题的提出 问题的提出 目录 研究现状 技术路线与方法 设计及实现 设计及实现(关键算法) 设计及实现(关键算法) 设计及实现(关键算法) 数据准备 软件运行 软件运行 软件运行 软件运行 软件运行 研究展望 参考文献 在线 评论 顾客:了解商品质量和口碑,以做出正确的购买决策 生产商和销售商:作为一种反馈机制可促进生产商和销售商改善和提升商品质量 但是,在线评论数量呈几何级增长,动辄几千条甚至上万条评论让用户感到无所适从,且从这些评论中获取商品的准确信息变得非常困难。 因此,迫切需要借助技术手段来分析这些在线评论,获取对商品评价客观的统计数 据,辅助用户的购买行为,商品在线评论的语义挖掘问题研究比较居多。 问题的提出 2 研究现状 3 4 5 技术路线与方法 设计及实现 软件运行 1 研究展望 6 词角度 采用词汇共现关系,通过确定词语与基准词的共现程度来计算词语的情感倾向极性 应用一种基于网络的无监督方法对情感短语的极性做判断 句子角度 篇章角度 基于语料库和词典的方法来研究句子的情感倾向性 采用多重冗余标记的CRF分析句子的情感极性 训练分类器对整篇电影评论进行情感极性判断 基于规则和统计相结合的方法对篇章级商品评论进行极 性判别 设置爬行种子URL,配置主题爬虫 主题爬虫爬取商品的在线评论 评论文本内容抽取及去噪 基于主题词设计情感倾向性 抽取商品属性特征的主题词描述 图形化展示情感分析结果 系统的软件结构图 在线评论抽取算法设计 主题词抽取的算法设计 情感倾向性分析算法设计 获取人工评论数据 为评测情感倾向性自动评分的准确率,设置了人工评分环 节,邀请从事语言学研究的专家参与人工评分共评价了 2 000 条自动抽取的在线评论。 获取在线数据 实验中所有数据均来自淘宝网,选择两款较流行的智能 手机,即小米手机和摩托罗拉ME525 + 手机 6大属性特征 各指标分值 质量和快递的主题词库覆盖范围太小,可从两个极性的角度建立更加均匀的主题词库,从而覆盖更多主题 1 情感倾向性分析算法有待改进,可从完整句子、甚至是篇章角度进行情感倾向性分析,获取更客观的情感倾向性极性 2 极性相反的原因 为更好地评测本系统,从两个方面做定量衡量: 决定了本系统的实用价值 描述了自动评分对于其数学期望的偏离程度,它可以辅助分析系统的准确率 A 准确率 B 方差 准确率计算公式: 准确率:80.1.% 方差:3.185 准确率:86.7% 方差:1.417 方差计算公式: √ 情感资源的建设和评价体系的建立 语句中各语义成分及其对应关系识别 系统研究的开展 在线商品评论经济价值的研究
您可能关注的文档
最近下载
- 2025年内蒙古呼和浩特市政府采购评审专家考试真题(附含答案).docx VIP
- 2023-2025中考化学真题分类汇编:专题05 元素考点01 元素及元素周期表.docx VIP
- 2025年内蒙古呼和浩特市政府采购评审专家考试真题含答案.docx VIP
- 98浙J30 卷帘门-标准图集.docx VIP
- 三年(2019-2021)中考真题化学-考点08原子结构(全国通用).docx VIP
- 2025年内蒙古呼和浩特市政府采购评审专家考试测试题及答案.docx VIP
- 二零二五版合同Amazon店铺代运营协议模板.docx VIP
- 《膝关节教学》课件.ppt VIP
- 神经系统专科评估.pptx
- 三年(2019-2021)中考真题化学-考点07分子和原子(全国通用).docx VIP
原创力文档

文档评论(0)