- 1、本文档共16页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体的中医文献诊疗信息的智能检索示范研究--《中国中医科学院》2012年博士论文.doc
基于本体的中医文献诊疗信息的智能检索示范研究--《中国中医科学院》2012年博士论文
现代中医临床诊疗研究开始重视从以往的研究和治疗经验得到论证和指导,期刊文献更新快,文献数量大,论文内容具有较高的学术价值、比较注意新的趋势和发展等优点,因此,对中医临床文献进行有效的检索至关重要。本研究旨在设计一个基于中医文献信息本体的智能检索模型,能够借助当前最新的语义网知识进行本体层次的设计和本体概念的研究,从而使检索模型具备基本的推理能力,提高查全率和查准率,能将输出结果按照相关性排序并进行统计,从检索到的批量文献中总结、发现和掌握所查专题内容的整体发展状况和遣方用药规律。
1.研究背景
现有的中医文献数据库大多是针对文献外部特征信息建立的,中医临床研究人员很难从检索到的批量文献中掌握所查专题内容的整体发展状况。传统的检索方式主要通过关键词、关键词串或者主题词来进行全文检索,用户很难表达其真正的检索意图,也很难从检索结果提供的大量文献中提取共性的规律。由于检索过程机械,不理解语义。导致一方面,检索结果中包含大量无关信息,另一方面,很多与关键词同义的信息却没能检索出来。其次,大量同领域或者相关领域的数据存储库往往使用不同的标识制度,不兼容的术语和不同的数据格式。目前中医药信息主要以自然描述为主,缺乏知识层次的科学表达,没有统一的术语定义,给数据的集成和共享造成了一定的困难。
2.研究内容
本研究以中医临床文献中的诊疗研究内容为对象,利用本体建设来实现中医文献信息的智能检索。本研究的研究过程主要包括确定研究目标、需求调研、数据采集、数据处理、建立本体、智能检索模型的设计和相关性排序算法、中医临床文献的智能检索模型、系统检索测试等八个部分。
2.1确定研究目标
本研究根据中医医生在临床实际研究中对于文献中所涉及的内容的检索需求,通过部分中医临床文献内容的语义分析和本体建设,实现基于中医临床文献信息的中医智能检索,提高查全率、查准率和输出结果相关性排序。能将输出结果按照相关性排序并进行统计,从检索到的批量文献中总结、发现和掌握所查专题内容的整体发展状况和遣方用药规律。
2.2需求调查
2.2.1对中医临床文献内容的调研
为了基本了解中医临床文献内部诊疗信息中各项信息出现频率以及之间的关系。总结文献中可以为中医临床诊疗研究提供的检索服务的支撑信息。选取中医核心期刊排名前几名的期刊,对其所刊登的2006-2007年度的关于中医临床诊疗研究的文献进行文献诊疗过程中理、法、方、药等信息记录的调研,发现临床作者诊疗研究的各种具体方向,并抽样调查部分文献中体现的具体数据需求。
2.2.2对中医临床医生和科研人员检索需求的调研
为了真正实现基于中医临床文献提供临床诊疗研究需求的检索服务,以调查问卷的形式进行小规模的调查,调查对象为三级甲等医院中的初、中、高级临床医师,共回收有效问卷200份。总结中医临床医生在诊疗研究过程中对文献信息检索的具体需求。经统计分析后,认为临床医师的检索需求重点停留在病、证、症及方剂和针灸疗法上,并且总结确定了一些常用检索式。
2.3数据采集
本研究的目的是实现中医临床文献信息的智能检索,而智能检索之前必须先确定用户的检索需求和检索的方式、对象,建立检索对象的本体,确定各个体之间的语义关联关系。资源库是检索的最基础的设施,是实现智能检索的最基本的保障,要保证资源库中有充足的可供检索的信息。
2.3.1资源库
本研究选择了中国中医科学院中医药信息研究所研制的中医疾病临床研究数据库和中药药理实验数据库。
2.3.2年代
由于资源库中共收录1988年至今的中医临床文献二十七万余篇,数据量庞大,选择基本已经加工完成且年代相对靠近的2005-2007年发表于期刊中的中医临床文献中所涉及的诊疗内容。
2.3.3原则
临床文献篇数比较多的疾病。所研究的对象一定要有一定的文献量,能展现所选年度内的临床研究热点和多发疾病的诊疗情况。
2.3.4内容
选取诊疗研究过程中涉及的疾病、证候、症状、治则、方剂、中药、穴位、药理分类等内容。
2.4数据处理
本研究将实施的本体建设和智能检索将基于已有的资源库进行,因此要对资源库中的数据进行数据清洗和规范整理。
2.4.1参考标准
数据处理必须遵循一定的原则,本研究选取美国国立医学图书馆研制的Mesh主题词表和中国中医研究院中医药信息研究所编制的中医药学主题词表为最基本的词表,并选取部分国标、《中华人民共和国药典》、《中药大辞典》等等作为词表的补充。
2.4.2规范流程
首先将各字段内容与标准词表中的正名进行匹配,匹配失败的词语与异名进行匹配,仍然无法与异名匹配的词语将纳入相似度计算范围,与词表中的正异名分别用Jaccard公式进行相似度计算。根据计算结果,
您可能关注的文档
- 中国古代史专题复习(超详细).doc
- 广州轨道交通嘉禾枢纽站设计及应用.doc
- 2011届营销论文待选题目.doc
- chap18 AJAX中的Web服务.pdf
- 湖北省城乡基本公共服务均等化现状及对策研究_以基础设施建设为例_方堃.pdf
- 人文社会科学基础试题及答案.doc
- 绵阳人事深入学习实践科学发展观活动专刊第 24 期.pdf
- 构建思想品德“和谐高效”课堂的思索.doc
- 2013注会教材变化(税法).pdf
- 关于企业人力资源管理制度绩效评价探讨.doc
- 浙江衢州市卫生健康委员会衢州市直公立医院高层次紧缺人才招聘11人笔试模拟试题参考答案详解.docx
- 浙江温州泰顺县退役军人事务局招聘编外工作人员笔试备考题库及参考答案详解一套.docx
- 江苏靖江市数据局公开招聘编外工作人员笔试模拟试题及参考答案详解.docx
- 广东茂名市公安局电白分局招聘警务辅助人员40人笔试模拟试题带答案详解.docx
- 江苏盐城市大丰区住房和城乡建设局招聘劳务派遣工作人员4人笔试模拟试题带答案详解.docx
- 浙江舟山岱山县东沙镇人民政府招聘笔试模拟试题及参考答案详解1套.docx
- 最高人民检察院直属事业单位2025年度公开招聘工作人员笔试模拟试题含答案详解.docx
- 浙江金华市委宣传部、中共金华市委网信办所属事业单位选调工作人员笔试备考题库及答案详解1套.docx
- 广东深圳市党建组织员招聘40人笔试模拟试题及答案详解1套.docx
- 江苏南京水利科学研究院招聘非在编工作人员4人笔试模拟试题及参考答案详解.docx
文档评论(0)