对象特征的抽取 评审格式: 格式2-区分正面、负面的评审 对象特征的抽取 评审格式: 格式3-自由格式 格式1中正面和负面评价的特征抽取 特征抽取基于以下的规定:每个正面和负面评价中的句子片段只包含一个特征。句子片段通过逗号、句号、分好、连字号、、and 、but分开。 例如 格式2、3中正面和负面评价的特征抽取 第一步:找到所有高频名词和名词短语,通过词性标注工具来识别。 第二步:利用意见词找到不频繁出现的特征。 第三步:观点倾向分类。 观点欺诈 观点欺诈指的是人们故意误导读者和自动观点挖掘系统的行为。 写欺诈性评审的目的主要有两个:推销某些目标对象;损害某些其他目标对象的声誉。 结构化数据抽取 Web信息抽取是从网页中抽取出目标信息。Web上的结构话数据一般是从后台数据库获取的数据记录,按照一定的模版被展现在网页上。抽取结构化的数据能够获取和整合来自多个来源(网站或者网页)的数据,以提供增值服务。 预备知识 富含数据的网页主要有两种:列表页;详情页。 列表页 每个列表页都包含有多个对象。一般从布局角度来看,可以在列表页上看到不同的数据区域(Data Region)。在每一个区域中,数据记录根据同一种模板被格式化。不同区域所采用的模板一般不同。 详情页 侧重描述一个对象。一般包括产品的所有细节,如名称、图片、价格和其他销售信息、产品描述、客户评价等。 网页格式 网页是用HT
您可能关注的文档
最近下载
- 物业异地分公司管理探究.doc
- 合规红线与避坑实操手册(2026)《NBT 35045-2014水电工程钢闸门制造安装及验收规范》.pptx VIP
- 抱朴子全文及译文讲解 抱朴子作者及朝代.pdf VIP
- 广东省2026届高三(二模)语文试卷(含案及解析).pdf
- 教师人工智能应用案例征集PPT模板.pptx VIP
- 2025年承德市围场满族蒙古族自治县小升初数学秋季入学摸底测试卷(含答案).doc VIP
- 第5课《孔乙己》练习(含答案)2024—2025学年统编版语文九年级下册.pdf VIP
- 合规红线与避坑实操手册(2026)《SLT 381—2021水利水电工程启闭机制造安装及验收规范》.pptx VIP
- 2026年人教版三年级数学下册期中测试卷(含答案解析)5套精品全.docx VIP
- 合规红线与避坑实操手册(2026)《NBT 35051-2015水电工程启闭机制造安装及验收规范》.pptx VIP
原创力文档

文档评论(0)