我使用的是JodConverter调用openoffice进行文档转化。
1、Maven导入JodConverter的两个版本:
com版:
<dependency>
<groupId>com.artofsolving</groupId>
<artifactId>jodconverter</artifactId>
<version>2.2.1</version>
</dependency>
org版:
<dependency>
<groupId>org.artofsolving.jodconverter</groupId>
<artifactId>jodconverter-core</artifactId>
<version>3.0-beta-4</version>
</dependency>
com版支持的文件类型:img、doc、ppt、xls
org 版支持的文件格式:img、doc、ppt、xls、docx、pptx、xlsx等
但是org版本在速度上没有优势,并且转换出来的文字清晰度比com版低一点。
并且在Maven中现在org版本一直导入失败需要手动导入。
手动导入Maven包,在cmd目录下,cd到Maven的bin目录下:(注意这是一个命令,不要换行)
mvn install:install-file -Dfile=E:\pdftest\jodconverter-core-3.0-beta-4.jar -DgroupId=org.artofsolving.jodconverter -DartifactId=jodconverter-core -Dversion=3.0-beta-4 -Dpackaging=jar
-Dfile 是下载下来的jar包的完整路径
2、添加文件队列到openoffice导致openoffice崩溃
我采用的处理方式是添加文件队列的时候,每次添加间隔0.5秒
3、关于多线程的支持
在上面提到的com版本应该是不支持openoffice启动多个端口,而org版本中已经支持开启多端口进程,使用多线程的方式开启多个OpenOffice实现并发转化文档。
文档预览之PDF.js实现PDF文件跨域预览(附测试实例):
http://blog.csdn.net/coding13/article/details/76930672
文档预览之office转pdf(附详细代码):
http://blog.csdn.net/Coding13/article/details/77010545
参考博文:
http://blog.csdn.net/u010504064/article/details/52711929(openoffice jodconverter 文档转换pdf过坑记录)