- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
基于互信息的二阶共现概念相关度研究
>>
第 卷 第 期 2009年9月
﹨ ﹣
基于互信息的二阶共现概念相关度研究
1,2 1 1
刘菊红 缪有刚 于建荣
1 2
中国科学院上海生命科学信息中心 上海200031 中国科学院国家科学图书馆 北京 100190
〔摘要〕中间集和目标集的膨胀,导致基于非相关文献知识发现的准确率低;基于排序的方法存在缺陷,且过度关
注B集的排序是对发现有趣的A、C的偏离。直接计算二阶共现概念相关度是基于非相关文献知识发现的薄弱
环节,以互信息方法和回归分析方法为基础,构造算法计算二阶共现概念之间的相关度。以PubMed收录的2型
糖尿病领域文献为样本,对算法的可行性进行实证研究。模型取得较好的效果,为二阶共现概念之间的关系提取
和评价提供新的方法。
〔关键词〕互信息 二阶共现 相关度 2型糖尿病 基于非相关文献的知识发现
〔分类号〕G353
ResearchofCorrelationStrengthofSecondOrderCoOccurrenceConceptsBasedonMutualInformation
1,2 1 2
LiuJuhong MiaoYougang YuJianrong
1ShanghaiInformationCenterforLifeSciences,ChineseAcademyofSciences,Shanghai200031
2NationalScienceLibrary,ChineseAcademyofSciences,Beijing100190
〔Abstract〕Explosionofintermediateconcepts(Bterms)andaimconcepts(Cterms)resultsinlowcorrectnessofdisjointliterature
baseddiscovery.ThemethodofrankinghasdrawbacksandfocusonrankingofBtermsisadepartureofdiscoveringinterestingrela
tionshipbetweenAtermsandCterms.Thepaperdesignsamodeltocalculatecorrelationstrengthofsecondordercooccurrencecon
ceptsdirectlybasedonmutualinformationmeasureandregressionmodel.Takingconceptsfromdiabetesmellitus,type2fromPubMed
asanexampletotestfeasibilityofthemodelandgaingoodeffects.ThemodelprovidesanewmethodtotherelationextractionofSec
ondOrderCoOccurrenceConcepts.
〔Keywords〕mutualinformation secondordercooccurrence correlationstrength diabetesmellitustype2 disjointliterature
baseddiscovery
排序,早期的中间集或目标集排序技术主要是基于词
1 引 言 频的排序技术。从基于单词的排序过渡到基于短语的
[1] [2]
排序 ,再上升到基于概念的排序 ,从绝对词频排序
自Swanson提出基于非相关文献知识发
您可能关注的文档
- 基于PML边界下的弹性及黏弹性TTI介质波场模拟-物理化学学报.PDF
- 基于PVDF的微力传感器设计-中国科学院沈阳自动化研究所.PDF
- 基于Proteus的气压报警系统设计-电子设计工程.PDF
- 基于rDNA-ITS序列的中国球盖菇科分子系统学.PDF
- 基于SCAP框架的信息系统安全基线技术研究与应用.PDF
- 基于SimpliciTI协议的智能窗系统的设计-电子设计工程.PDF
- 基于SOD-IRK的大规模时滞电力系统特征值计算方法-电力系统自动化.PDF
- 基于SIFT特征向量的图像检索优化-应用数学和力学.PDF
- 基于SPI指数的内蒙古干旱时空分布特征研究.PDF
- 基于SPEI和SPI指数的太原多尺度干旱特征与气候-生态环境学报.PDF
- 基于互相关的有效奇异值消噪方法-计算机工程与应用.PDF
- 基于五大类使用主体的秦岭绿道示范段使用后-西安建筑科技大学学报.PDF
- 基于交叉增益调制的全光单边带上变频研究-激光与红外.PDF
- 基于交错网格的纵横波波场分离数值模拟方法-工业技术创新.PDF
- 基于以太网和RS485总线的小型微网控制系统设计-云南大学.PDF
- 基于亮度保持的子图像加权对比度增强-电子学报.PDF
- 基于介词向量的英语真词错误检查算法-计算机系统应用.PDF
- 基于传声器阵列的汽车鸣笛声定位算法及实现-噪声与振动控制-上海.PDF
- 基于优进策略的遗传算法对重油热解模型参数的估计-高校化学工程学报.PDF
- 基于保护动机理论的护理干预对糖尿病患者血糖监测的-中国护理管理.PDF
最近下载
- 能源科技有限公司100MW200MWh储能项目110KV升压站安全预评价报告.doc VIP
- 评估公司内部管理制度.doc VIP
- 西师大版五年级上册小学数学期中试卷.pdf VIP
- PEP三年级英语上册 Unit 6单元练习题.doc VIP
- 新解读《EJ_T 287-2000氚内照射剂量估算与评价方法》最新解读.docx VIP
- 统编人教版高中地理必修第一册第一、二章章节单元测试卷(含答案解析).pdf VIP
- 北师大版八年级数学上册 第二章 实数 单元检测试题(有答案).docx VIP
- 风电、光伏项目前期及建设手续办理流程汇编.docx
- 地籍档案管理基本知识 完整版2025.pdf VIP
- 金属非金属矿山安全规程培训.pptx
文档评论(0)