蒙古文音乐领域的语义检索初探.PDFVIP

  • 9
  • 0
  • 约2.26万字
  • 约 7页
  • 2018-03-02 发布于天津
  • 举报
蒙古文音乐领域的语义检索初探

应用论文 蒙古文音乐领域的语义检索初探* 鲍玉来 1,2 毕 强 2 1( 内蒙古大学图书馆 呼和浩特 010021) 2(吉林大学管理学院 长春 130022) 摘要: 【目的 】在蒙古文信息资源急剧增长的背景下, 探索将基于本体的语义检索应用到蒙古文领域, 提高蒙古 文信息资源检索效果。【方法 】利用本体技术重视推理、互联的优势, 借助语义解析与推理工具Jena 的规则推理 引擎, 设计并实现了基于蒙古文音乐领域本体的蒙古文语义检索系统。【结果 】相较于关键词匹配检索, 语义检 索系统查全率达到 95.6%、查准率达到93.2%, 明显高于关键词匹配检索。【局限 】仅以蒙古族多声部音乐为研 究对象, 实验对象数据有限, 检索具有一定的局限性。【结论 】对基于蒙古文领域本体的语义检索进行了完整的 研究, 为蒙古文语义网应用研究打下良好的理论和技术基础。 关键词: 蒙古文领域本体 语义推理 语义检索 分类号: TP182 G353 数民族语言中使用范围、社会影响及国际知名度比较 1 引 言 广泛的语种[6] 。蒙古文有34 个字母, 其中包含7 个元 互联网发展有两种明显的趋势: 信息资源的语义 音字母和27 个辅音字母。蒙古文的拼写是以词为单位 化; 用户与信息资源的多语言化[1] 。其实, 当前不仅英 竖写, 一个词内字母连着写, 词之间用空格分开, 总 语、汉语、俄语等语言网络信息资源在急剧增长, 随 的书写规则是从上到下连写, 从左到右移行。蒙古文 着中国少数民族文献信息资源建设的推进, 各类少数 的每个字母在字首、字中、字尾有不同的变体; 有的 民族语言的网络信息资源也在飞速增加, 尤其是传统 变体有多种形式, 导致这些变体字母的书写形式不一 蒙古语(简称蒙古文)信息资源建设经过几十年的艰苦 致, 存在一字多形、多字同形、形同音不同的现象。 努力, 从无到有, 取得了令人瞩目的成就。如内蒙古蒙古 此外, 蒙古文中有一套非常复杂而严密的正字法规则 文报网联盟平台、耶理巴蒙古文文献管理系统[2]、蒙古 和语法规则[7], 所有的这些特点导致它不能按字母读 [3] [4] 文期刊网 、中国蒙古学信息网 等。此外, 内蒙古大 音检索, 以至于蒙古文被称为最难检索的文字之一。 学图书馆参加了“ 中美百万册数字图书馆合作计划”, 随着语义网的提出, 本体成为语义网新的研究方 共完成了 6 000 余种蒙古文现代图书数字化, 建立了 向和热点。国内研究人员对语义网的探索主要集中在 “蒙古文资源全文数据库”[5] 。在此背景下, 如何高效地 本体构建和语义检索两方面, 构建了一些具有推理能 获取有价值的蒙古文信息资源, 为蒙古文用户提供更 力的系统。Li 等[8]提出一种基于描述逻辑的组合推理 有效的检索服务, 成为当下蒙古文信息资源数字化建 方法。Huang 等[9]提出利用语义相似度计算获得粗糙 设亟待解决的难题。 本体中的隐藏信息, 实现了关联信息的挖掘。孟红伟 传统蒙古语属于阿尔泰语系, 主要使用者分布在 等[10]通过对文献领域本体中的重要概念进行语义标注 中国内蒙古自治区、辽宁省、黑龙江省、吉林省、甘 和语义相似度计算, 提高文献检索的准确度。周群芳 肃省、青海省、新疆维吾尔自治区等地区, 是中国少 等[11]设计一个基于 Jena 推理和Lucene 框架的专利语 通讯作者: 鲍玉来, ORCID: 0000-0003-2528-5412, E-mail:。 *本文系国家自然科学基金项目“基于领域本体的蒙古文数字资源整合机制研究”(项目编号:的研究成果之一。 94 现代图书情报技术 总第276 期 2016 年 第11 期

文档评论(0)

1亿VIP精品文档

相关文档