- 1、本文档共5页,可阅读全部内容。
- 2、原创力文档(book118)网站文档一经付费(服务费),不意味着购买了该文档的版权,仅供个人/单位学习、研究之用,不得用于商业用途,未经授权,严禁复制、发行、汇编、翻译或者网络传播等,侵权必究。
- 3、本站所有内容均由合作方或网友上传,本站不对文档的完整性、权威性及其观点立场正确性做任何保证或承诺!文档内容仅供研究参考,付费前请自行鉴别。如您付费,意味着您自己接受本站规则且自行承担风险,本站不退款、不进行额外附加服务;查看《如何避免下载的几个坑》。如果您已付费下载过本站文档,您可以点击 这里二次下载。
- 4、如文档侵犯商业秘密、侵犯著作权、侵犯人身权等,请点击“版权申诉”(推荐),也可以打举报电话:400-050-0827(电话支持时间:9:00-18:30)。
查看更多
上海傲蓝科技
PAGE
PAGE 1
用Java从Doc和Docx格式的Word文档中提取图片
Doc和Docx的文档格式因为存储格式不一样,所以需要用不通的方法提取图片。Docx格式的文档实际上是压缩文件,用程序提取图片相对实际上只需要对文章进行解压缩,然后到指定文件夹找到图片即可。Doc文档则需要把图片数据读出来,再生成文件。下面代码均可直接运行。
从Docx文件中提取图片的代码:
package com.onlan.docx;
import java.io.BufferedInputStream;
import java.io.BufferedOutputStream;
import java.io.File;
import java.io.FileOutputStream;
import java.util.Enumeration;
import java.util.zip.ZipEntry;
import java.util.zip.ZipFile;
public class ImgExt4Docx {
/**
* @param args
*/
static final int BUFFER = 2048;
public static void main(String[] args) {
String inputFilename = D:/work/test.docx;
String unZipPathname = D:/work/unZipDir/;
ImgExt4Docx ied=new ImgExt4Docx();
System.out.println(ied.unZipDocx(inputFilename,unZipPathname));
}
/*
* return the fold of the images
*/
public String unZipDocx(String docxfile,String destDir)
{
try{
String inputFilename = docxfile;
String unZipPathname = destDir;
ZipFile zipFile = new ZipFile(inputFilename);
Enumeration enu = zipFile.entries();
int i = 0;
while(enu.hasMoreElements()){
ZipEntry zipEntry = (ZipEntry)enu.nextElement();
if(zipEntry.isDirectory()){
new File(unZipPathname+zipEntry.getName()).mkdirs();
continue;
}
BufferedInputStream bis = new BufferedInputStream(zipFile.getInputStream(zipEntry));
File file = new File(unZipPathname+zipEntry.getName());
File parent = file.getParentFile();
if(parent != null !parent.exists()){
parent.mkdirs();
}
FileOutputStream fos = new FileOutputStream(file);
BufferedOutputStream bos = new BufferedOutputSt
您可能关注的文档
最近下载
- 2023年福建考评员考试答案.docx VIP
- 河南省洛阳涧西区2022—2023学年七年级下学期期中考试语文试卷.docx VIP
- 英语中考短语大全.doc VIP
- 2024《企业盈利能力分析的国内外文献综述》2400字.docx VIP
- 蓝碳生态系统碳汇计量监测技术规程.pdf VIP
- 2025年开封文化艺术职业学院单招职业适应性测试题库及答案一套.docx VIP
- 【广东卷】广东省2025年深圳市高三年级第一次调研考试(深圳一模)(2.19-2.21)化学试卷含答案或解析.pdf
- 医院护理品管圈:降低住院患儿雾化吸入的不配合率.ppt
- 2024年村居后备干部面试试题整理.doc
- 广东省深圳市宝安区2021-2022学年八年级下学期期末数学试卷(Word版含答案).docx VIP
文档评论(0)