意见挖掘.pptVIP

  • 16
  • 0
  • 约1.2千字
  • 约 19页
  • 2018-09-04 发布于河北
  • 举报
意见挖掘

基于数据挖掘技术的网络商品在线评论意见倾向性分析研究 姜瑜斐 李真真 问题的提出 问题的提出 问题的提出 目录 研究现状 技术路线与方法 设计及实现 设计及实现(关键算法) 设计及实现(关键算法) 设计及实现(关键算法) 数据准备 软件运行 软件运行 软件运行 软件运行 软件运行 研究展望 参考文献 在线 评论 顾客:了解商品质量和口碑,以做出正确的购买决策 生产商和销售商:作为一种反馈机制可促进生产商和销售商改善和提升商品质量 但是,在线评论数量呈几何级增长,动辄几千条甚至上万条评论让用户感到无所适从,且从这些评论中获取商品的准确信息变得非常困难。 因此,迫切需要借助技术手段来分析这些在线评论,获取对商品评价客观的统计数 据,辅助用户的购买行为,商品在线评论的语义挖掘问题研究比较居多。 问题的提出 2 研究现状 3 4 5 技术路线与方法 设计及实现 软件运行 1 研究展望 6 词角度 采用词汇共现关系,通过确定词语与基准词的共现程度来计算词语的情感倾向极性 应用一种基于网络的无监督方法对情感短语的极性做判断 句子角度 篇章角度 基于语料库和词典的方法来研究句子的情感倾向性 采用多重冗余标记的CRF分析句子的情感极性 训练分类器对整篇电影评论进行情感极性判断 基于规则和统计相结合的方法对篇章级商品评论进行极 性判别 设置爬行种子URL,配置主题爬虫 主题爬虫爬取商品的在线评论 评论文本内容抽取及去噪 基于主题词设计情感倾向性 抽取商品属性特征的主题词描述 图形化展示情感分析结果 系统的软件结构图 在线评论抽取算法设计 主题词抽取的算法设计 情感倾向性分析算法设计 获取人工评论数据 为评测情感倾向性自动评分的准确率,设置了人工评分环 节,邀请从事语言学研究的专家参与人工评分共评价了 2 000 条自动抽取的在线评论。 获取在线数据 实验中所有数据均来自淘宝网,选择两款较流行的智能 手机,即小米手机和摩托罗拉ME525 + 手机 6大属性特征 各指标分值 质量和快递的主题词库覆盖范围太小,可从两个极性的角度建立更加均匀的主题词库,从而覆盖更多主题 1 情感倾向性分析算法有待改进,可从完整句子、甚至是篇章角度进行情感倾向性分析,获取更客观的情感倾向性极性 2 极性相反的原因 为更好地评测本系统,从两个方面做定量衡量: 决定了本系统的实用价值 描述了自动评分对于其数学期望的偏离程度,它可以辅助分析系统的准确率 A 准确率 B 方差 准确率计算公式: 准确率:80.1.% 方差:3.185 准确率:86.7% 方差:1.417 方差计算公式: √ 情感资源的建设和评价体系的建立 语句中各语义成分及其对应关系识别 系统研究的开展 在线商品评论经济价值的研究

文档评论(0)

1亿VIP精品文档

相关文档