- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于本体楚辞书目相关检索研究
基于本体楚辞书目相关检索研究
[摘要]结合楚辞古籍文献的特点,分析楚辞书目实体款目相关性的主要内容及款目间的关联关系,利用本体建模元语定义楚辞书目的类、属性、属性关系和实例,构建楚辞书目本体,实现楚辞书目语义关联检索。通过实例列举直接语义关联检索、间接语义关键检索和语义智能推理检索功能及其实现,并对检索结果的关联程度进行数据统计对比分析。最后提出将楚辞数字目录与相关古籍内容关联的进一步构想。 (关键词]楚辞书目 本体 相关性 关联检索 语义 [分类号]G254.36 1 引言 楚辞是战国时期以屈原为代表的楚国人创作的诗歌,2000多年以来,楚辞研究者留下了300多种专著、2000多篇论文以及近千种札记,南通大学图书馆和楚辞研究中心采用计算机技术,对收集到的楚辞相关古籍里的文字、图像符号、地图等进行扫描并转化为能被计算机识别的数字符号,进而制成电子索引并通过元数据标引建成楚辞书目数据库和全文数据库,实现关联检索。目前已经完成了近百本楚辞相关古籍的数字化和3000余篇楚辞相关古籍研究论文的全文数字化工作,建成了楚辞书目库、楚辞论文索引库、楚辞音像资料库及楚辞相关古籍全文库等。本文在此基础上利用本体技术对楚辞书目进行语义相关性分析,并构建楚辞书目本体以实现楚辞数字目录语义检索,改进传统检索系统只能查询关键词而缺少概念间语义关联的局限,增强检索结果的相关性和联想性。 2 楚辞书目相关性分析 传统的书目检索主要依赖于关键词,读者常常因为缺乏对目标词清晰准确的界定,导致检索的准确度和效率不高,同时由于系统极少提供书目关联信息,读者难以沿着感兴趣的文献线索持续检索并发现更多感兴趣的线索。为此,我们在对楚辞相关古籍文献数字化的过程中,首先分析楚辞书目之间的关联性,即选择了楚辞学界公认较权威的姜亮夫先生的《楚辞书目五种》作为底本进行分析。该书从目录学角度将楚辞相关古籍分成5种:楚辞书目提要、楚辞图谱提要、绍骚隅录、楚辞札记目录和楚辞论文目录。分析楚辞书目结构,发现楚辞相关古籍目录结构主要包括古籍作品实体款目、楚辞原著词条实体款目、参见实体款目、责任者实体款目、版本实体款目、载体形态实体款目、人名实体款目、地名实体款目、年代实体款目、音乐实体款目、节庆实体款目、植物实体款目、馆藏实体款目、研究实体款目等,这些款目之间存在着内容和形式上的多种相关性,如表1所示: 3 楚辞书目本体构建与书目相关检索实现 3.1楚辞书目本体构建过程 为了具体实现楚辞古籍实体款目之间的相关性,我们利用本体论思想和本体建模工具构建楚辞书目本体。Perez等人按分类法组织和归纳出了本体包含的5个基本的建模元语(modeling primitive),这些元语分别为类(classes)、关系(relations)、函数(functions)、公理(axioms)和实例(instanees)。楚辞书目本体的构建基于上文对楚辞书目相关性的详尽分析,并参照了FRBR概念关系模型、Perez的五元组分类法,以《楚辞书目五种》对楚辞相关文献的归纳与划分的书目结构为素材,利用本体建模元语构建的楚辞书目本体共包括35个本体类,24个对象属性,20个数据类型属性,约5300个实例。 3.3.1创建楚辞书目本体的类 本体类是一种特殊的资源,它描述了具有共同特征或者在某方面相似的资源的集合。楚辞书目本体的类基于《楚辞书目五种》以及表1对楚辞??古籍实例间的关联分析,划分出了35个基本本体类。部分基本类如表2所示: 3.3.2定义楚辞书目本体的对象属性 对象属性是实体间的联系,在资源描述中充当谓语作用。依据《楚辞书目五种》及其涉及的楚辞相关古籍的背景和内容,构建了24个楚辞书目本体的对象属性,示意图见表3。表中注释(comment)是为了帮助用户理解代码而添加的,通过成为标注(annotation)的属性标签来让计算机读取。定义域指定了使用当前待描述属性的陈述中充当主语的所有个体的类型。值域指定了所有个体的类型或者所有文字的数据类型,并且这些个体或文字在使用当前待描述属性的陈述中充当宾语。 3.3.3确定楚辞书目本体的数据类型属性 数据类型属性用来连接实体的一些文字值,它不可以作为陈述的主语,只能做为宾语。比如人名的字、号、笔名、官职等,书目的出版地、内容等,馆藏图书的版本、版本类型、版本注释、版本形态、版本评论等,音乐作品的曾用名、作品url地址等。例如描述人名实体用string类型,描述年龄实体用int类型等。 3.3.4用protege工具实现楚辞书目本体 本文采用protege软件来实现楚辞书目本体的可视化,该软件提供r很好的可视化界面操作,可以很方便地添加类和属性,可以生成xml、turtl、rdf或owl格式的本体
您可能关注的文档
最近下载
- 中学地理学科课程标准与教材研究教学大纲.pdf VIP
- 中建X局各类建筑工程技术经济指标.docx VIP
- 我们的手上有多少细菌?.doc VIP
- 第一单元 观察物体 大单元教学设计2025数学人教版三年级上册(新教材).pdf
- 年东北财经大学国际商学院(校本部) 联招联考项目招生指南.pdf VIP
- 驾驶员安全生产操作规程 - 生产安全.docx VIP
- 公务员(国考)之行政职业能力测验题库附答案(基础题)收藏.docx VIP
- 全册部编版六年级上册全册道德与法治教学课件.pptx
- 第二章-空气流动压力及阻力.pptx VIP
- 2025年全国农产品质量安全检测技能竞赛理论知识考试题库(含答案.docx VIP
文档评论(0)