- 1、本文档共10页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 5、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 6、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 7、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 8、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
基于Web 的Word 文档管理系统设计.doc
基于Web 的Word 文档管理系统设计
摘要:在Windows系统中,使用Ruby on Rails 4框架设计一个基于Web的word文档管理系统。系统具有在线预览、全文检索、版本控制、文本比较和可控下载等功能。
关键词:word;文档管理;Ruby on Rails 4
中图分类号:TP311 文献标识码:A 文章编号:1009-3044(2016)11-0053-03
企业日常运营中会大量使用到电子文档,一般以微软word文档、excel文档、图片、音视频等形式存在;其中word文档应用范围广泛、数量巨大。从内容上说,包括商务合同、会议记录、产品手册、客户资料、设计文档、推广文案、竞争对手资料、项目文档、心得等。为了有效地存储、管理大量的文档,文档管理系统应运而生。一个实用性的文档管理系统,应具有在线预览、全文检索、版本控制、文本比较和可控下载等功能;其余如访问控制、加密存储、在线协作等不是本文讨论的重点。
在Windows系统中,使用Ruby on Rails 4框架(以下简称RoR4),配合第三方软件设计一个基于Web的word文档管理系统,使其具有上述功能。
1 软件
为了实现前述功能,除RoR4产品环境所需的必要软件外,还需安装以下软件。
1.1 DocToText
DocToText是一个跨平台的命令行工具,支持把DOC、RTF和DOCX等格式转换为UTF-8编码的纯文本。将DocToText.exe保存到服务器,并将所在路径添加到系统环境变量Path中即可。命令格式如下:
doctotext [文件名] [文本文件]
[文本文件]中的内容即为获取的纯文本内容。
1.2 Beyond Compare 4
Beyond Compare 4是一款商业软件(以下简称BC4),主要用于文件,文本的比较;支持doc、docx、pdf、html等文件,目前最新版本为4.1.5。BC4还支持命令行操作,将安装路径添加到系统环境变量Path中后,即可使用BCompare命令对两个文件进行比较;比较完成后会生成一个html文件用以存储及现实比较结果。命令格式如下:
BCompare.exe /silent @[参数文件] [文件1] [文件2] [输出网页文件]
1.3 word2pdf
word2pdf是一款免费软件,能够批量将doc、docx、rtf、txt和htm文件转换为pdf文件。word2pdf还支持命令行操作,将安装路径添加到系统环境变量Path中后,即可使用word2pdf.exe命令进行命令行下的批量转换。命令格式如下:
word2pdf.exe /source [文件1] [文件2] [文件3] /target [输出路径]
1.4 ImageMagick
ImageMagick是一个跨平台的、用于图像处理的软件包,能对多种格式的图片进行读写操作[1],能够把pdf文件转换为图片。
1.4.1 Ghostscript
Ghostscript是PDF和PostScript语言的解释器[2]。ImageMagick转换pdf文件时需要调用到它。直接下载安装即可,目前最新版本为9.19。
1.4.2 安装并配置ImageMagick
根据系统情况下载合适的ImageMagick并默认安装。在Windows系统中,convert是系统内置命令,和ImageMagick的命令冲突,所以要人工修改。进入ImageMagick安装目录,将convert.exe重命名,如IMconvert.exe。打开注册表编辑器,搜索ImageMagick安装目录,如“C:\Program Files\ImageMagick-6.9.3-Q16”,将搜索到的名为AutoRun的键,值改为修改后的程序路径,如“C:\Program Files\ImageMagick-6.9.3-Q16\IMconvert.exe $*”。
使用ImageMagick将pdf文件转换为jpg等图片时,会按页转换。即在PDF中的一页对应一张图片,图片以数字后缀的形式排列,后缀0表示第一页。命令格式如下:
IMconvert -density [分辨率] [pdf文件][页码范围] [jpg文件]
分辨率即图片的DPI,普通图片72即可,如果对清晰度要求较高,或有较多文字,建议设置为150,如果有大幅打印需求,可以设置为300或更高。
页码范围可缺省,缺省时表示整个文件;页码0表示第一页,支持逗号分隔及连字符,如[0-3,12-25,29]。
jpg文件为输出文件名,当pdf文件多页输
文档评论(0)