- 1、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。。
- 2、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 3、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
- 4、该文档为VIP文档,如果想要下载,成为VIP会员后,下载免费。
- 5、成为VIP后,下载本文档将扣除1次下载权益。下载后,不支持退款、换文档。如有疑问请联系我们。
- 6、成为VIP后,您将拥有八大权益,权益包括:VIP文档下载权益、阅读免打扰、文档格式转换、高级专利检索、专属身份标志、高级客服、多端互通、版权登记。
- 7、VIP文档为合作方或网友上传,每下载1次, 网站将根据用户上传文档的质量评分、类型等,对文档贡献者给予高额补贴、流量扶持。如果你也想贡献VIP文档。上传文档
查看更多
金软PDF文本抽出
PDF文本抽出?
一.产品概述
金软PDF文本抽出工具是一款由北京信久通科技有限公司独立开发的专门从PDF文件批量抽出文本到文本文件中的工具,它可以批处理同时为多个PDF文件抽出文本,功能强大。
本程序支持的PDF版本:
?PDF 1.0
??PDF 1.1
??PDF 1.2
??PDF 1.3
??PDF 1.4
??PDF 1.5
??PDF 1.6
??PDF 1.7
?可以从上述的各种编码字符集数据文件中抽取文本。
?本程序支持的可转换的字符集:
??EUC-JP
??EUC-JP-FIX
??ISO-10646-UCS-2
??ISO-10646-UCS-4
??ISO-2022-JP
??ISO-8859-1
??Shift_JIS
??UTF-16
??UTF-8、WINDOWS31J
??ChineseGBK
??ChineseBIG5
??GB18030
??KoreanKSC
??Shift_JIS-2004
??ISO-2022-JP-2004
??EUC-JIS-2004
?本程序支持的可抽出的字符串:
??Unicode字符集
??日语
??英语(只限于拉丁字母字符集ISO_8859-1)
??汉语(简体字 GB18030、GBK、繁体字Big5)
??韩语(KS_C_5601_1987)的字符串
?使用上述语言外的字体时,无法保证抽出结果的正确性。
?抽出后的文本有17种字符编码集可供选择。抽出后文本的编码方式所使用的基本字符集中所没有的字符,转换为类似的字符 1个字符或1个字符的组合 。当没有类似的字符时替换为〓(2个字节)、? 1个字节 。
?无法从有密码保护的文件中抽出文本。有密码保护的文件必须事先在源程序中解除安全设置。
?PDF文本抽出工具还具有快速、稳定、安全的特点,其操作方便,简单;界面清爽,灵动。它是PDF的一个辅助软件,其操作方便简单。
二.功能介绍
1. 支持17种常见可转换字符集
2. 支持5中常见的语言
3.支持在输出文件名末尾加文件生成日期后缀
4. 支持批量处理,操作简便,节省您的时间
5. 文件格式自动识别功能
本产品通过解析文件内部的信息,自动识别生成文件的应用程序名和其版本号,不依赖于文件的扩展名,能够正确识别文件格式和相应的版本信息。
6. 文本抽出功能
即使系统中没有安装作成文件的应用程序,可以从指定的文件或插入到文件中的OLE中抽出文本数据。
7. 文件属性抽出功能
从指定的文件中,抽出文件属性信息。
点此进入产品试用版下载
原创力文档


文档评论(0)