基于同义实体识别的web信息集成①-计算机系统应用.pdfVIP

  • 3
  • 0
  • 约3.14万字
  • 约 8页
  • 2017-10-30 发布于天津
  • 举报

基于同义实体识别的web信息集成①-计算机系统应用.pdf

基于同义实体识别的web信息集成①-计算机系统应用

2015 年 第 24 卷 第 9 期 计 算 机 系 统 应 用 基于同义实体识别的 Web 信息集成① 徐喆昊, 吴共庆, 胡学钢 (合肥工业大学 计算机系, 合肥 230009) 摘 要: 准确有效地集成海量 Web 信息, 是 Web 信息动态聚合、市场情报分析、舆情分析、商业智能等分析型 应用的重要基础. 针对数据集成过程中不同实体指代同一实体的问题, 利用搜索引擎返回的页面摘要信息, 设计 并实现了一种基于搜索引擎的同义实体识别算法FSE, 并提出了一种基于同义实体识别的Web 信息集成框架. 在 医院信息集成测试数据集上的实验结果表明, FSE 算法效果优于基于 VarientDice 、VarientCosine 、VarientJaccard 、 VarientOverlap 相似度计算的同义实体识别算法. 关键词: Web 信息集成; 同义实体识别; 相似度计算; 搜索引擎 Web Information Integration Based on Synonymous Ent

文档评论(0)

1亿VIP精品文档

相关文档