搜索微信公众【 Jet与编程 】体验更多有趣功能和文章哦。
Word 转 pdf 有很多的解决方案,比如先转 html 在转 pdf,但是或多或少都有各种奇(yang)怪(shi)的问题,有一款软件“Aspose”(其实就是一个 jar 包),体验下来很不错,提供了 word 的各种操作 api,但是很可惜是收费的。
身为“贫穷”程序猿的一员,能免费肯定要免费啊,于是就想手动处(po)理(jie)一下这个 jar 包。
我们先从官网下载 jar 包,地址:https://downloads.aspose.com/words/java,或者也可在文末下载。
本文下载的是19.1 版本(版本不一致的话,class 中的方法名也可能会有所小差异)。
在此查看 jar 包内详情使用的工具是:JByteMod,文末有下载链接。
追踪源码,我们发现了罪魁祸首,其实就是 License.class 这个文件,然后发现license 的方法内斗指向了一个类zzZLJ,所以接着追踪这个类,然后研究后发现,只需要将 zzZI0 和 zzZI1 方法的返回值调整为 true 即可,并将 zzZ 方法内的校验步骤删掉。见下图:
很简单,分两步。
第一步是清除掉 zzZ 方法内的内容,在此使用的是上文提到的 JByteMod 工具,见下图:
第二步是改写 zzZI0 和 zzZI1 方法的返回值,在此使用的是 javassist 工具,需要手动写个测试类去修改内部的方法并生成一个新的 class 文件,见下述代码:
<dependency> <groupId>org.javassist</groupId> <artifactId>javassist</artifactId> <version>3.24.1-GA</version> </dependency>
import javassist.ClassPool; import javassist.CtClass; import javassist.CtMethod; public class AsposeWordsCrack191 { public static void main(String[] args) { try { AsposeWordsCrack191.changeMethod(); } catch (Exception e) { e.printStackTrace(); } } public static void changeMethod() throws Exception { ClassPool.getDefault().insertClassPath("d://aspose-words-19.1-jdk16.jar"); CtClass c2 = ClassPool.getDefault() .getCtClass("com.aspose.words.zzZLJ"); CtMethod[] ms = c2.getDeclaredMethods(); for (CtMethod c : ms) { System.out.println("method name: " + c.getName() + "() ,Parameter:"); CtClass[] ps = c.getParameterTypes(); if (c.getName().equals("zzZ") && ps.length == 3 && ps[0].getName().equals("org.w3c.dom.Node") && ps[1].getName().equals("org.w3c.dom.Node") && ps[2].getName().equals("java.lang.String")) { System.out.println("I got you!zzZ"); c.insertBefore("{return;}"); } if (c.getName().equals("zzZI1")) { System.out.println("I got you!zzZI1"); c.insertBefore("{return 1;}"); } if (c.getName().equals("zzZI0")) { System.out.println("I got you!zzZI0"); c.insertBefore("{return 1;}"); } } //输出到当前目录下 c2.writeFile(); } }
使用上述代码可以生成一个 zzZLJ.class 文件,我们只需要将这个文件替换掉 jar 包内的原始文件即可,在此可以随便找一款压缩工具即可。
但是需要注意,为了防止文件指纹校验,我们需要删除掉 jar 包中的 META_INF 文件夹。
最后,需要生成一个许可文件 com.aspose.words.lic_2999.xml,将其放在 jar 包内即可(不放也可以,但是在checkLicense()方法内读取的时候,需要自己处理下路径),如图:
<License> <Data> <Products> <Product>Aspose.Words for Java</Product> </Products> <EditionType>Enterprise</EditionType> <SubscriptionExpiry>29991231</SubscriptionExpiry> <LicenseExpiry>29991231</LicenseExpiry> <SerialNumber>www.jetchen.cn</SerialNumber> </Data> <Signature>www.jetchen.cn</Signature> </License>
至于使用也相当简单,但是有一个坑需要注意,经测试发现,在 Windows 平台一切正常,但是在 centos 环境下,转换出来的 pdf 文件中,中文都被替换成了小方框,很显然,是缺少字体的原因。
解决办法有两种,一是在服务器上安装相应的字体库,二是将 Windows 的字体库 copy 一份到服务器上,然后在项目里引用即可。在此推荐第二种,因为第一种有可能会面临重启服务器的情况,并且最主要的是,第一种方案有可能会对服务器上的其他项目产生影响。(附Windows 上 font路径: C:/Windows/Fonts,有好几百兆哦)
官方文档: https://docs.aspose.com/display/wordsjava/True+Type+Fonts
public class CrackSample { public static void main(String[] args) throws Exception { String baseDir = "D://temp//"; doc2pdf(baseDir + "text.docx", baseDir + "test.pdf"); } /** * @Description: 验证License * @Param: [] * @return: boolean * @Author: Jet.Chen * @Date: 2019/4/8 11:52 */ public static boolean checkLicense() throws Exception { boolean result = false; try { InputStream is = com.aspose.words.Document.class .getResourceAsStream("/com.aspose.words.lic_2999.xml”); if (is == null) return false; License asposeLicense = new License(); asposeLicense.setLicense(is); System.out.println("Aspose isLicensed: " + asposeLicense.isLicensed()); result = true; is.close(); } catch (Exception e) { e.printStackTrace(); throw e; } return result; } public static void doc2pdf(String inPath, String outPath) throws Exception { // 验证License 否则转出的pdf文档有水印 if (!checkLicense()) { throw new Exception("com.aspose.words lic ERROR!"); } try { File file = new File(outPath); FileOutputStream os = new FileOutputStream(file); if (!System.getProperty("os.name").toLowerCase().startsWith("windows")) { // linux 需要配置字体库 FontSettings.getDefaultInstance().setFontsFolder("/data/crm/fonts", false); } // 读原始文档 Document doc = new Document(inPath); // 转 pdf doc.save(os, SaveFormat.PDF); } catch (Exception e) { e.printStackTrace(); } } }
1、aspose 原版 jar 包:
链接:https://pan.baidu.com/s/1Ve-4d5i8PijYxILxSGSq-g,提取码:gpm9
2、aspose track 版 jar 包:
链接:https://pan.baidu.com/s/1AMfyg1noQOPf8PN4C66K1Q,提取码:g9h9
3、JByteMod:
链接:https://pan.baidu.com/s/1mINmfulqD6sUBehPjTnIxA,提取码:3yx8
参考:https://blog.csdn.net/shadowkiss/article/details/80868472