本文主要是介绍Apache PDFBox 3最新入门指南(3.0.0-alpha2 released版本),希望对大家解决编程问题提供一定的参考价值,需要的开发者们随着小编来一起学习吧!
PDFBOX的8个作用:
1、提取文字:
提取pdf中的Unicode 文本
2、分割和合并PDF
分割单个PDF为多个PDF或者是合并多个PDF为一个DPF
3、填充PDF里面的表单
提取PDF表单内容或填充PDF表单
4、印前检查
根据PDF/A-1b标准,校验PDF文件。
5、打印PDF
通过JAVA的API打印PDF文件。
6、图片转换
把PDF文件转成PNG或JPEG格式的图片
7、创建PDF文件
从零开始创建PDF文件,往里面嵌入文字和图片
8、签名
对PDF文件签名
背景:
基于对Apache PDFBox的热爱,我想根据Apache PDFBox 3研究一下是如何使用,及改进了哪些内容。
相较于2.0版本的差异:
(1)3.0版本保留了PDPageContentStream的一些废弃方法(appendRawCommands)。
(2)3.0版本需要把PDDocument.load 改成Loader.loadPDF 方法。
(3)3.0版本增加了非压缩模式的保存PDF。通过PDDocument.save 方法的 CompressParameters.NO_COMPRESSION参数完成。
例如从原来的
doc.save(pdfPath);
变成
doc.save(pdfPath, CompressParameters.NO_COMPRESSION);
(4)3.0版本优化了操作PDF文件时的内容消耗。
(5)3.0版本相较于2.0版本删除了14种字头。
(6)修改PDDocumentCatalog.getAcroForm()获取AcroForms对象。例如使用命令:
PDDocumentCatalog.getAcroForm(null)
(7)重写了PDFBox应用程序的命令行接口。
参考链接:
Apache PDFBox | PDFBox 3.0 Migration GuideThe Apache PDFBox™ library is an open source Java tool for working with PDF documents. This project allows creation of new PDF documents, manipulation of existing documents and the ability to extract content from documents. Apache PDFBox also includes several command-line utilities. Apache PDFBox is published under the Apache License v2.0.https://pdfbox.apache.org/3.0/migration.html
这篇关于Apache PDFBox 3最新入门指南(3.0.0-alpha2 released版本)的文章就介绍到这儿,希望我们推荐的文章对编程师们有所帮助!