基于语义主题模型的知识系统框架设计及应用研究.pdfVIP

基于语义主题模型的知识系统框架设计及应用研究.pdf

  1. 1、本文档共4页,可阅读全部内容。
  2. 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
  3. 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载
  4. 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
  5. 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
  6. 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们
  7. 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
  8. 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于语义主题模型的知识系统框架设计及应用研究

本期话题 http: // 基于“语义主题模型”的 知识系统框架设计及应用研究* □ 李颖 / 中国科学技术信息研究所 北京 100038 张毅 / 北京外国语大学 北京 100089 摘要:构建语义化知识服务系统是数字图书馆在语义Web环境下的发展方向。针对目前各种语义Web技 术在数字图书馆开发应用的现状和问题,本研究融合国际基于Topic的语义知识组织技术,结合国内的需求, 提 出了“语义主题模型”,目标为构建可实施的语义化知识系统。文章首先对以 “概念化主题、主题关联、语 义标签”为内涵的 “语义主题化模型”概念进行定义;其次,设计基于此模型的语义化知识系统框架;再次, 对相关应用进行了探讨;最后,对未来开发工作进行了规划。 关键词:语义主题模型,知识系统框架,主题 DOI :10.3772/j .issn .1673—2286.2012.04.005 背景及研究动机 真正满足用户意图检索的需求。可以想象,任何强大的 语义技术和自然语言处理技术,都不可能将无序化的 主题(Top ic )与图书馆学的主题(Subj ect )为同 海量资源处理为理想的结构化知识系统。“Garbage In , 义词,本研究侧重人脑的概念主题在计算机上的实 Garbage out ”,为获取关联的知识,系统入口的底层资 现,故采用Topic这一术语。由于主题直接表现概念, 源本身的结构化处理必不可缺。尽管针对期刊、专利和 主题著录和主题元数据描述、主题索引和导航是图书 图书等各种资源,有基于X ML Sch em a 的各种结构化 馆信息学永恒的研究课题。针对全球性的知识服务需 标准,但它们没有在对象的粒度、语义主题化组织及主 求,面对语义Web 技术所带来的机遇与挑战,如何实 题关联上进行系统的考虑。而这些是知识的主要属性, 现传统主题理论的继承与升华?相关研究和技术在 不能割裂地考虑。为此,本研究提出了“语义主题模 国内外日趋凸显。国际上,从上世纪90年代起,Top ic 型”的概念(详见第1部分内容),就是为了弥补该方向 和Ont olog y 等与主题相关的概念进入了知识系统。 的研究空白,用以构建全新的知识系统。在国内,有关 主题图(Topic Map s)和DITA (达尔文信息类型化体 知识系统的构建研究,跟踪和效仿国际领先技术的综 系结构)、资源描述框架(R DF )、关联数据 (Lin k ed 述较多,实用化大规模的知识服务系统很少。尤其在面 D at a ),以及资源描述与检索(R DA )等国际标准技 向企业创新需求的知识系统构建方面,几乎没有成型的 术,都深化了主题的理念。某种程度上,这些国际标准 架构体系来指引企业的知识系统构建。比起底层资源 技术满足了用户对资源的知识获取需求,也满足了知识 和用户导航层的构建,研究多集中在元数据层,从系统 重用的客观环境需求。然而,这些技术的焦点主要集中 的角度来看,不是一种协同发展的良好模式。 于从元层来描述形形色色的资源,很少将资源自身的结 本研究的动机如下: 构化构建或重建纳入系统的整体框架设计之中,很难 理论层面:“语义主题模型” 是针对构建知识系 * 基金项目:“十二五科技支撑计划——科技知识组织体系共享服务平台建设”资金支持(编号:2011BAH10B03-2);中国科学技术信息研究所“汉语科技词系统建设与应用工程”重点工作和国家科技 支撑计划“面向外文科技文献信息的超级科技词表和本体建设”子任务支持。 年第 期(总第 期) 201

文档评论(0)

***** + 关注
实名认证
文档贡献者

该用户很懒,什么也没介绍

1亿VIP精品文档

相关文档