- 1、本文档共7页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于语义特征扩展的知识库增量引文推荐算法 - 山东大学学报(理学版)
第51卷 第11期 山 东 大 学 学 报 (理 学 版) 2016年11月
Vol.51 No.11 JournalofShandongUniversity(NaturalScience) Nov.2016
文章编号:16719352(2016)11002607 DOI:106040/j.issn.16719352.1.2015E14
基于语义特征扩展的知识库增量
引文推荐算法
徐也,徐蔚然
(北京邮电大学信息与通信工程学院,北京 100876)
摘要:将知识库增量引文推荐(cumulativecitationrecommendation,CCR)任务分解为3个基本的关键问题:针对知
识库某一实体名的查询扩展;针对文档和实体的特征提取;基于线性和非线性相结合的分类模型。提出了基于语
义词典(DBpedia)与词向量(wordembedding)相结合的方法进行查询扩展,以及利用LDA和ESA两种算法对文
档进行特征提取,最终通过线性逻辑回归与非线性随机森林相融合的分类算法实现CCR算法。与基线系统相比,
该方法在TRECKBA2014评测数据上的试验结果的F平均提升了14.7%,表明本文设计的方法能够较好地解决
1
引文推荐问题。
关键词:知识库;查询扩展;特征提取;分类
中图分类号:TP391 文献标志码:A
引用格式:徐也,徐蔚然.基于语义特征扩展的知识库增量引文推荐算法[J].山东大学学报(理学版),2016,51(11):2632.
Algorithmofknowledgebasecumulativecitationrecommendation
basedonsemanticfeaturesexpansion
XUYe,XUWeiran
(SchoolofInformationandCommunicationandEngineering,BeijingUniversityofPostsandTelecommunications,
Beijing100876,China)
Abstract:Thetaskofknowledgebasecumulativecitationrecommendationwasmainlydecomposedintothreebasickey
problems:queryexpansionbasedonanentitynameinknowledgebase,featureextractionfordocumentsandentities.
Weproposedamethodthatusingthecombinationofthesemanticdictionary(DBpedia)andthewordvector(wordem
bedding)forqueryexpansion,andusingLDAandESAalgorithmsforfeatureextraction.Finallyclassifydocuments
basedonlinearLogisticRegresioncombinedwithunlinearrandomforest.TheF valueofthissystemoperatedon
1
TRECKBA2014promoted14.7% comparedtothebaseline,whichindicatedthatthemeth
文档评论(0)