- 22
- 0
- 约4.79千字
- 约 8页
- 2018-08-30 发布于福建
- 举报
基于距离度量实体识别算法
基于距离度量实体识别算法
摘 要:传统的实体识别中,往往是利用字符串相似性函数来计算元组对在每个属性值上的相似度从而来判断它们总的相似性(例如,元组对的相似性等于每个属性值上的相似度的加权求和)。然而这一类相似性测度不能够反映属性值内部不同的词在元组对相似性计算中的不同重要性。由于不能区分哪些词对元组对匹配更重要,就导致仍然存在某些匹配的元组相似性不高,而不匹配的元组相似性高的情况,故很难将匹配元组对和不匹配元组对有效区分开。为了解决这个问题,我们提出了以词为特征的距离度量函数,设计了基于词特征的距离度量学习算法,和基于距离度量的实体识别算法。扩展性实验对我们所提出的算法的有效性进行了验证。
关键词:实体识别;相似性测度;距离度量;度量学习
中图分类号:TP704.25
Abstract: Traditional entity resolution methods always use string-based similarity functions to compute the similarities of attribute-values between records and then compute the similarity between records based on these similarities, i.e., the sim
您可能关注的文档
- 基于贝叶斯网络施工项目进度计划动态更新方法.doc
- 基于贝叶斯网络管理绩效评价方法.doc
- 基于贝叶斯网络航班离港延误预警分析.doc
- 基于贝叶斯网络网络营销风险评估和管理研究综述.doc
- 基于贝叶斯网络营销风险评价研究.doc
- 基于贝叶斯网络输变电工程静态投资预测.doc
- 基于贝尔宾角色理论教学团队建设研究与实践.doc
- 基于贝尔宾角色理论团队建设.doc
- 基于贝尔模型大米品牌形象因素结构研究.doc
- 基于贝瑞隆模型输电线路差动保护研究.doc
- 2026踝关节扭伤治疗.pptx
- 2026急性化脓性胆管炎护理查房.pptx
- 2024-2025学年上海市金山区世外学校七年级(下)期末数学试卷(含解析).docx
- 2024-2025学年上海市闵行区七年级(下)期末数学试卷(含解析).docx
- 2024-2025学年上海市浦东新区八年级(下)期末数学试卷(含解析).docx
- 2024-2025学年上海市浦东新区建平实验中学八年级(下)期末数学试卷(含解析).docx
- 2024-2025学年上海市黄浦区八年级(下)期末数学试卷(含解析).docx
- 2024-2025学年上海市浦东新区洋泾菊园实验学校八年级(下)期末数学试卷(含解析).docx
- Morse跌倒评估量表应用(2026) - 副本.pptx
- 镇痛消肿的护理效果评价.pptx
最近下载
- 近3年统计中级真题高频考点重复率深度分析.docx
- 2024版煤矿安全生产标准化管理体系--通风部分解读.pptx VIP
- (2026版)电力重大事故隐患判定标准及治理监督管理规定PPT课件.pptx VIP
- ADR监测与安全用药课件.ppt VIP
- DB11T 2541-2026花园城市建设指南.docx VIP
- 2026 人教版小学数学五年级下册期末综合测试卷(3 套完整版 含名师答案解析 可直接打印).docx
- T_CEC 1148-2025 燃煤电厂汽轮机状态检修导则 中文版(状态评估).docx VIP
- 汽轮机的“真空严密性试验”和“破坏真空”.pdf VIP
- 精品解析:河南省郑州市郑东新区2024-2025学年统编版2016五年级下学期期末语文试卷(原卷版).docx VIP
- 儿童肥胖的饮食与运动.pptx VIP
原创力文档

文档评论(0)