- 6
- 0
- 约5.68千字
- 约 13页
- 2018-08-31 发布于福建
- 举报
基于页面分块与信息熵评论发现及抽取
基于页面分块与信息熵评论发现及抽取
摘 要:提出了一种新颖的REA(Review Extract Algorithm)算法进行评论信息的发现与抽取。算法采用了页面分块与信息熵的迭代计算技术实现了评论块的自动发现与抽取。其中,页面分块技术的运用有效地去除了噪声信息;基于块的熵值计算精确定位了每一个用户评论。实验结果证明该算法具有较高的查全率与查准率。
关键词:评论抽取;自动;语义块;熵??
中图法分类号:TP311.13文献标识码:A
文章编号:1001―3695(2007)02―0269―03
随着电子商务的迅猛发展,越来越多的商家开始进行网上销售,并且也有越来越多的人选择网上购物。为了能让潜在用户了解已购买过某产品用户的满意程度与购买经验,多数商家都会要求用户对所购买的商品进行评价,以便为潜在用户提供购买参考。结果使得Web上关于某类产品的评论信息迅猛增长,潜在用户难以阅读这些众多的评论信息,从而难以帮助他们进行购买取向的决策。对产品的评论信息进行抽取与分析的工作就显得非常必要。近年来,众多研究者对评论抽取技术作出了深入研究,提出了具有重要价值的有效算法。然而,针对目前复杂多样的Web页面,进行评论抽取工作主要存在以下问题:①网页页面结构复杂,页面中含有大量的与主题无关的信息,这些无关信息称作噪声信息。这些噪声信息的存在将大大影响信息抽取的质量。②
您可能关注的文档
- 基于隐核最小二乘回归逆控制.doc
- 基于隐喻分析英语教师角色与远程学习者因素分析.doc
- 基于隐性负债视角企业财务行为分析.doc
- 基于隐私保护数据挖掘技术研究.doc
- 基于隐性资产企业价值管理研究.doc
- 基于隐语义模型智能算法设计.doc
- 基于隐语义模型和用户信任个性化模型.doc
- 基于隐结构模型名老中医诊治慢性支气管炎用药规律探讨.doc
- 基于隐马尔可夫场脊柱CT图像分割算法.doc
- 基于隐马尔可夫模型多摄像头人体对象目标识别.doc
- 2022年重庆一中高考历史考前适应性试卷.pdf
- 深圳的生物多样性保护(2026)-深圳市生态环境局.pptx
- 2026年ASCO生物医学追踪数据监测医疗保健规划师 2026 Biomedtracker Datamonitor Healthcare ASCO Planner.pptx
- 模板安全设施设计专篇正文(初稿).pdf
- 北京市朝阳区2022-2023学年高三上学期期末生物试卷.pdf
- 北京市东城区2022-2023学年高三上学期期末语文试题.pdf
- 北京市平谷区2022-2023学年高二上学期期末语文试卷.pdf
- 北京市顺义区2022-2023学年高二上学期期末质量检测化学试题.pdf
- 北京市西城区2022-2023学年高三上学期期末语文试题.pdf
- 福建省福州第四中学2022-2023学年高二上学期期末考试化学试卷.pdf
最近下载
- 阴道分泌物检查课件课件.pptx VIP
- 中考英语完形填空讲解4-选词填空提分策略.doc VIP
- DB23T 2976-2021 消费品召回管理工作指南.docx VIP
- 室外排水及采暖外网工程施工方案方案.docx
- “巴渝工匠”杯重庆市第三届数字技能大赛(计算机及外部设备装配调试员赛项)考试题库(含答案).docx
- 2025湖北武汉东新区中考五调物理试卷.pdf VIP
- DB23T 3008-2021 水稻种质资源评价与保存技术规程.docx VIP
- 2024年校园招聘标准简历模板 .pdf VIP
- 新22J07 室外工程图集.docx VIP
- 数学中考重难点03 二次函数的最值问题(19种题型汇总+专题训练+10种解题方法)(解析版).pdf VIP
原创力文档

文档评论(0)