- 4
- 0
- 约2.25万字
- 约 5页
- 2019-01-05 发布于四川
- 举报
第30卷第6期 计算机应用与软件 Vol30No.6
2013年6月 ComputerApplicationsandSoftware Jun.2013
基于概念语义相似度计算模型的信息检索研究
杨春龙 顾春华
(华东理工大学信息科学与工程学院 上海200237)
摘 要 以电子商务领域本体为基础,旨在提出一种改进的基于概念语义相似度计算模型,该模型结合基于距离和基于内容两个
方面,能够更为全面精确地量化本体中概念结点之间的语义相似度。据此,进行查询关键词集概念扩展和查询与结果文档的相似度
计算,最终形成检索算法。实验对比于Lucene检索算法,通过选取热点概念关键词从准确率、召回率、响应速度3个指标来评估检
索算法的性能。实验证明,提出的检索算法与基于Lucene的信息检索方法相比,检索性能有较大提高。
关键词 领域本体 概念语义相似度 准确率 召回率 信息检索
中图分类号 TP311 文献标识码 A DOI:10.3969/j.issn.1000386x.2013.06.024
ONINFORMATIONRETRIEVALBASEDONCONCEPTSEMANTIC
SIMILARITYCOMPUTATIONMODEL
YangChunlong GuChunhua
(SchoolofInformationScienceandEngineering,EastChinaUniversityofScienceandTechnology,Shanghai200237,China)
Abstract Takingecommercedomainontologyasthebasis,inthepaperweaimatproposinganimprovedcomputationmodelwhichis
basedonconceptsemanticsimilarity.Themodelintegratesthetwoaspectsofdistancebasedandcontentbased,canquantifythesemantic
similaritybetweentheconceptnodesofontologymorecomprehensivelyandaccurately.Accordingly,itextendstheconceptofquerykeywords
setandcalculatesthesimilarityofthequeryandtheresultingdocument,andfinallygeneratestheretrievalalgorithmaspresentedinthis
paper.InexperimentwecompareitwiththeLuceneretrievalalgorithm,andevaluatetheperformanceoftheretrievalalgorithminthepaper
throughchoosingkeywordsoffocusconceptintermsofthreeindicators:precision,recallandresponsespeed.Experimentprovesthatthe
proposedretrievalalgorithminthispaperhasgreaterimprovementinretrievalperformancecomparedwiththeinformationretrievalmethod
basedonLucene.
Keywords Domainontology Conceptsemanticsimilarity Precision Recall Informationretrieval
本文在已有技术基础上提出一个更为全面、精确地量化概念间
0 引 言 语义相似度的计算模型
原创力文档

文档评论(0)