科技文献检索系统语义丰富化框架的设计与实践.PDF

科技文献检索系统语义丰富化框架的设计与实践.PDF

科技文献检索系统语义丰富化框架的设计与实践

应用论文 科技文献检索系统语义丰富化框架的设计 与实践* 谢 靖 王敬东 吴振新 张智雄 王 颖 叶志飞 ( 中国科学院文献情报中心 北京 100190) 摘要: 【目的 】通过采用语义识别、知识关系计算等方法提升科技文献检索系统的服务功能和效果, 使之能够呈 现更加丰富的知识化语义信息, 将更多的知识点和知识关系展现给用户。【方法 】应用数据挖掘和关系计算工具, 深度识别和抽取科技文献中的语义知识, 分析、计算、构建语义关系, 并将得到的语义知识和语义关系建立多维 语义索引树, 设计新的数据组织呈现模型。【结果 】研发语义丰富化检索示范系统, 在科技文献检索应用过程中 充分揭示语义信息, 丰富检索体验。【局限 】选取的试验数据集合不够充足, 缺少其他领域应用对比。【结论 】本 文模型设计给用户带来更多的知识层面的关联、揭示和导航, 提升了检索系统体验。同时分析了设计模型的不 足之处, 探索改进方法。 关键词: 语义丰富化 语义知识组织 语义关系呈现 多维索引 分类号: TP391 1 引 言 Knowledge Graph[3], 利用知识图谱改进传统搜索引擎 的呈现方式, 分析用户输入生成关联的百科知识, 辅 随着语义技术、知识图谱和本体技术的迅速发展 助组织多类型语义知识及多媒体展现, 很大程度提升 和在科技文献中的应用, 如何发掘揭示科技文献之间 [4] [5] 了用户检索体验。知名的WolframAlpha 和Kngine 的语义关系, 充分利用知识和体现知识价值, 是当今 智能语义搜索引擎, 更是将语义搜索展现为一种智能 科技文献检索关注的重点。人们不再满足原有“关键词 知识问答方式。在强大的百科知识库和知识图谱支持 +检索列表”模式的检索系统, 而希望通过语义途径检 基础上, 对用户输入问题智能解析、搜索并给出相关 索发现科技文献, 在科技文献的检索系统中呈现知识 的答案。 点和知识关系等更加丰富的内容。语义丰富化框架的 知识图谱的搜索引擎仅对用户输入进行语义丰富 设计目标是改进现有单一关键词导向的检索系统, 将 多种类型的语义知识[1], 知识之间丰富的关联关系等 化, 揭示知识图谱中的既有知识, 不能发现科技文献本 深层信息, 利用数据挖掘与呈现技术重新组织, 在科 身潜在的知识。在文献发现过程中依然采用传统检索架 技文献检索过程中充分揭示出来。 构, 使用列表方式呈现相关文献。而SindiceTech[6]平台 的研究应用, 实现了对文本数据的深度拆解、语义关 2 语义丰富化现状分析及研究意义 系计算等智能方法, 将海量文本数据全部用RDF 三元 [2] 组[7]方式表示, 以发现文本中潜在知识为向导, 形成 当前基于知识图谱 的语义搜索引擎, 如 Google 通讯作者: 吴振新, ORCID: 0000-0003-4966-1961, E-mail: wuzx@ 。 *本文系中国科学院文献情报能力建设专项“基于大数据计算的资源发现平台建设”(项目编号: 院1676)和国家社会科学基金青年 项目“基于关联数据的学术资源深度挖掘方法研究”(项

您可能关注的文档

文档评论(0)

1亿VIP精品文档

相关文档