- 1、本文档共50页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
湖南大学毕业设计(论文) 第 PAGE II页
PAGE
湖南大学软件学院
HUNAN
毕业设计(论文)
设计(论文)题目:基于WordXML的多维论文
自动抽取组件设计
PAGE
基于WordXML的多维论文自动抽取组件设计
摘 要
多维科技论文是一种新式的科技论文,可以在科技论文创作平台帮助下,进行方便高效地编辑。较之传统论文,它拥有更丰富地表达方式,如音频、视频、动画、图片等。突破传统科技论文发表周期长、表达方式单一等诸多限制,实现作者、读者、编审人员的跨时空沟通和零距离管理。
当前的科技论文发表主要是以传统的word格式的文档为主,格式要求严格细致。科技论文工作者往往要花费大量的时间和精力对论文的内容和格式进行修改。这个过程繁琐而低效。
本论文研究如何将word文档导入到多维论文中,通过wordxml方法对word文档中的元素结构进行自动分析,结合Office Word编程对象实现了对word文档中的标题、作者、email、关键字、正文、图片、音频、视频、动画等元素的自动抽取的相关方法,使用数据结构在多维论文平台中建立起树型结构,有序地表示元素,从而完成了word文档中各元素的识别,帮助论文工作者免除了大量的繁琐过程。设计程序时,还考虑到用户界面的友好性,将识别出的内容立即显示到界面。该组件使用office word编程接口,可以作为独立的文件格式转换器使用,也可集成于多维论文创作平台,移植性强。下一步研究更多文档的xml结构,可以将多种格式的文档兼容,实现多种格式论文的导入多维论文。
关键字:officeword二次开发,xml,多维论文
Design of multi-dimension thesis abstraction component based on WordXML
Author: Ju Zhang
Tutor: Hao Chen
Abstract
Multi-dimension scientific paper is a new style thesis, which can be edited effectively with the help of scientific paper composition platform. Compared to traditional paper, multi-dimension scientific paper owns richer presentation methods: audio, video,animation,pictures etc.break through the restrictions of long delivery circle, single presentation methods and implement the zero-distant communication and management of author, reader, editor.
Current delivered scientific paper can be categorized to traditional word document and is formatted strictly. The paper composer must pay plenty of time and energy to modify the content and format. The whole process is tedious and low efficient.
This paper focus on how to import word document to multi-dimension platform, and analysis elements of word document by wordxml automatically and implement the auto elements extraction of title, author, email, keywords, context, pictures, audio, video, animation etc., build the tree-type structure of extracted elements with relative data structure and help the composer avoid redundant work. This component can be not only used
文档评论(0)