基于本体论体系的中医药一体化语言系统中国中医研究.pptxVIP

基于本体论体系的中医药一体化语言系统中国中医研究.pptx

  1. 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
  2. 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  3. 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  4. 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  5. 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  6. 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  7. 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体论体系的中医药一体化语言系统中国中医研究会计学第1页/共16页一、研究目的与意义: 现状:中医药学科历经千年,产生了大量的概念与术语,多种语义词汇差异,阻碍了中医药数字化的发展。 目的与意义: 以中医药学科体系为核心,遵循中医药学科理论体系,建立中国第一个计算机化的、可持续发展的、包含中医药及其相关学科语言的中医药学语言集成系统,形成中医药学的语言系统平台。 本系统的建成将为中医药学的标准化工作、为中医药学数据的文本挖掘、为中医药学多源数据库歧义词检索及语义检索奠定基础。 第2页/共16页二、研究思路:以中医药学科的整体系统为基础;利用本体论的方法;借鉴(UMLS)美国一体化语言系统的思路;根据中医药语言学特点,建立大型语料数据 库,并设计语义类型与语义关联关系。将语言学与中医药学知识体系有机的结合在一起,建立中医药一体化语言系统。第3页/共16页三、方法:从四方面入手研究 以中医药为核心,其他学科叠加:中医药信息化过程中使用与利用的所有相关的学科与概念、术语中医药一体化语言系统中医药中医药语言结构体系一体化:建立、融入中医药术语表达方式一体化:词条属性中医药概念定义与释义形式一体化:回答是 什 么、关联关系是什么、学科中的位置是什么相同概念词一体化:无论文字、图表、正名与 异名、正确与误用一体化海量语言术语集成为基础:制定收词范围、顺序规范化网状结构解释概念的语义归类与关联:多水平控制:词汇、形态、语义、语用;本体论与诠释论相结合语言设计分层结构与网状立体结构;符合语言体系,限定与约定复杂度;采用归纳定性,将同类事物合并;参照UMLS的整体结构,保持兼容性与包容性;系统保持灵活性与可扩展性 ;系统中医药为核心Protégé程序第4页/共16页四、研究内容:标准四种可控词表的结构比较词典语料库(收词40万)总体系统设计教材概念词属性定义临床术语设计词条属性结构其他完成概念词属性设计语用关系(5万)建立中医药一级分类体系(13)语义表达以中医五、六版教材的学科分类为依据定义实现中医药概念的语义类型设计(105种)事件与物质二大类的结构展开中医学科结构立体表达关系等级关系相关关系(时间、空间、概念、功能、物理)中医药语义的关联关系(58种)第5页/共16页五、组织机构与管理全国十三家大学、科研单位(100)任务分配加工编辑第6页/共16页六、研究成果:建立了六个专题的中医药一体化语言系统(中医基础、治则治法、诊断、疾病、方剂、中药) ;进行了本系统结构设计;建立了实现本系统的技术标准与操作手册;完成了三个专题的结构设计;中医基础部分已召开了专家论证会;实现结构与概念关联:中医基础第7页/共16页第8页/共16页成果语料库收词:61.09万条。加工词条:50074条。方剂27987条中药12610条中医基础3739条治法诊法2378条疾病2524条第9页/共16页七、应用与推广:语言集成与规范建立数据 库基础语言平台检索查询应用工具数据挖掘与知识再现支撑条件小结:第10页/共16页( 1)首次提出中医药学一体化语言系统设计思想与原则;(2)首次提出中医药学一体化语言系统的选词原则与词条属性定义;(3)首次提出中医药学一体化语言系统的语义类型与语义关联设计。(4)解决了海量数据的收集与编辑加工。 本项研究在国内领域属于先进技术;成果将广泛应用于中医药标准化建设、中医药数据利用等领域中,具有良好的应用前景 。第11页/共16页谢谢!第12页/共16页中医药语言现状(现代文献收词已超过60万条)多样性(同名异物) (异物同名)无标准化(缺少国标)无统一机读词库缺少系统结构第13页/共16页借鉴美国UMLS(医学一体化语言系统)医学文献计算机化60年1986年起步开始研制医学语言一体化。超级叙词表语义网络情报源图谱专家词典2002年(第13版)收录了60 多个生物医学受控词表中776940个概念共210万个词第14页/共16页本体论哲学上的概念,用于描述事物的本质。在近一、二十年来,本体论已被计算机领域所采用,用于知识表达、知识共享。本体论是一种回答:存在是什么?第15页/共16页不同体系的融入

文档评论(0)

kuailelaifenxian + 关注
官方认证
文档贡献者

该用户很懒,什么也没介绍

认证主体太仓市沙溪镇牛文库商务信息咨询服务部
IP属地上海
统一社会信用代码/组织机构代码
92320585MA1WRHUU8N

1亿VIP精品文档

相关文档