Wikipedia中的语义析取.pdf

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
2009年 l0月 北 京 航 空 航 天 大 学 学 报 October 2009 第35卷 第 1O期 JournalofBeijiugUniversityofAeronauticsandAstronautics Vo1.35 NO.10 Wikipedia中的语义析取 余 呖 林漳希 (北京航空航天大学 经济管理学院,北京 100191) (德克萨斯理工大学 管理学院,德克萨斯 79410) 夏国平 (北京航空航天大学 经济管理学院,北京 100191) 摘 要:维基百科 (Wikipedia)现有搜索模块采用关键词匹配方式导致搜索效率相对 低下.为了提高Wikipedia中的知识获取效率,提 出基于链接分析的词 间距算法 (TDL,Term Distancebas;edonLinkage).利用可扩展的计算模型,通过 内部链接结构分析发现词簇,并且引 入排序和推荐机制.基于Wikipedia2009年5月快照数据的实验表 明,TDL有效增强了Wiki— pedia知识检 索的准确性,经 由用户评判检验证 实TDL算法能有效提高用户意图识别度达 7% . 关 键 词:Wikipedia;链接分析;知识发现 中图分类号 :TPl82 文献标识码 :A 文 章 编 号:1001-5965(2009)10—1283-04 ExtractingthematiccommunitiesfrOm W ikipedia Yu Yang (SchoolofEconomicsandManagement,BeijingUniversityofAeronauticsandAstronautics,Beijing100191,China) Lin Zhangxi (TheRawlsCollegeofBusinessAdministration,TexasTechUniversity,Texas79410,U.S.A) XiaGuoping (SchoolofEconomicsandManagement,BeijingUniversityofAeronauticsandAstronautics,Beijiug100191,China) Abstract:ThecurrentsearchmoduleinW ikipediahaslow searchefficiencyduetothesearch method, which isbuiltonsimplekeywordsmatching.Toimprovetheefficiencyofknowledgeretrievalfrom theW ikipe— diasphereswithnloreaccuratelinksamongthem,thealgorithmnamedtermdistancebasedonlinkage(TDL) wasproposed.TDLdefinesanew measureofdistancebetweentwokeywords,whichreorientsandorganizes thosekeywordsintoclusters.Itisbasedon link structureanalysisunderpinnedbycomputationalmodels.The mechanism ofranking and recommendingwasimported.The experiment,which based on the snapshotof Wik

文档评论(0)

叶峰 + 关注
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档