基于本体的办公文档处理的研究.pdfVIP

  • 4
  • 0
  • 约2.09万字
  • 约 6页
  • 2015-08-04 发布于安徽
  • 举报
2010 of ConferenceonDocumentInformation 2010全国文档信息处理学术会议论文集Proceedings Processing 基于本体的办公文档处理研究 田英爱张钰晗 (北京信息科技大学计算机学院,北京,100101) 摘要 目前的办公文档通常都是基于XML格式的,其树型存储结构中包括逻辑内容、格式描述、页面版式描述以及编 辑元素描述,它们之间既相互分离又相互融合,给文档的处理带来复杂性。论文分析了办公文档的结构特征,提出了在两 种典型应用处理场景中基于本体的文档操作方法。本体的引入可以使办公文档的处理能够根据不同的应用环境,通过机器 推理机制实现丈档处理的智能化,同时有利于实现文档处理的互操作;在处理过程中节点的定位相对于XPath更高效,并 能够满足在特定应用中,文档的处理不破坏文档的基本结构需求。本文以中文办公软件格式标准UOF为基础建立基于本体 的文档结构模型,并利用SWRL推理规则,实现办公文档的智能化处理。 关键词 办公文档,本体,智能操作,机器理解,UOF 中图法分类号TP317.2 文献标识码A ResearchonOfficeDocument Basedon ProcessingOntology Yu··ban TIAN ZHANG Ymg·-ai tnformationScienceand Technology 100101,01ina) (SchoolofComputer,Beijing University,Bcijmg arc basedonXML.Itincludes content Abstract documentformats nodes,formatnodes, Currently,office usually S0111时logic style nodesandsome elementnodesinitstree s1Tucmr己Itraisessomeissuesfor pagelayoutdescribing editing storage processing. thecharacteristicsofdocument twomethodsofdocument underdifferent Paper structure,and analyses processing typical scenarioswhichbasedon ale isintroduced document ontology ontologytechnology into,office application presented.As canbereasonedmachine tovariousenvironmentsandtobeexecuted thes锄硷timeit processing by according automatically,at some

文档评论(0)

1亿VIP精品文档

相关文档