基于互信息的二阶共现概念相关度研究.PDF

基于互信息的二阶共现概念相关度研究.PDF

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于互信息的二阶共现概念相关度研究

>> 第 卷 第 期 2009年9月   ﹨ ﹣ 基于互信息的二阶共现概念相关度研究 1,2 1 1 刘菊红  缪有刚 于建荣 1 2 中国科学院上海生命科学信息中心 上海200031  中国科学院国家科学图书馆 北京 100190 〔摘要〕中间集和目标集的膨胀,导致基于非相关文献知识发现的准确率低;基于排序的方法存在缺陷,且过度关 注B集的排序是对发现有趣的A、C的偏离。直接计算二阶共现概念相关度是基于非相关文献知识发现的薄弱 环节,以互信息方法和回归分析方法为基础,构造算法计算二阶共现概念之间的相关度。以PubMed收录的2型 糖尿病领域文献为样本,对算法的可行性进行实证研究。模型取得较好的效果,为二阶共现概念之间的关系提取 和评价提供新的方法。 〔关键词〕互信息 二阶共现 相关度 2型糖尿病 基于非相关文献的知识发现 〔分类号〕G353 ResearchofCorrelationStrengthofSecondOrderCoOccurrenceConceptsBasedonMutualInformation 1,2 1 2 LiuJuhong  MiaoYougang YuJianrong 1ShanghaiInformationCenterforLifeSciences,ChineseAcademyofSciences,Shanghai200031 2NationalScienceLibrary,ChineseAcademyofSciences,Beijing100190 〔Abstract〕Explosionofintermediateconcepts(Bterms)andaimconcepts(Cterms)resultsinlowcorrectnessofdisjointliterature baseddiscovery.ThemethodofrankinghasdrawbacksandfocusonrankingofBtermsisadepartureofdiscoveringinterestingrela tionshipbetweenAtermsandCterms.Thepaperdesignsamodeltocalculatecorrelationstrengthofsecondordercooccurrencecon ceptsdirectlybasedonmutualinformationmeasureandregressionmodel.Takingconceptsfromdiabetesmellitus,type2fromPubMed asanexampletotestfeasibilityofthemodelandgaingoodeffects.ThemodelprovidesanewmethodtotherelationextractionofSec ondOrderCoOccurrenceConcepts. 〔Keywords〕mutualinformation secondordercooccurrence correlationstrength diabetesmellitustype2 disjointliterature baseddiscovery 排序,早期的中间集或目标集排序技术主要是基于词 1 引 言 频的排序技术。从基于单词的排序过渡到基于短语的 [1] [2] 排序 ,再上升到基于概念的排序 ,从绝对词频排序   自Swanson提出基于非相关文献知识发

您可能关注的文档

文档评论(0)

xiaozu + 关注
实名认证
内容提供者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档