【JAVA秒会技术之玩转PDF】IText转PDF秒会

简介:  IText转PDF秒会        最近在开发过程中,碰到了这样的需求:将图片及相关文字信息,按视觉标准,排版后直接转成PDF。因为之前没接触过,乍一听很懵,感觉会很难。但经过一番网上搜索学习后,发现其实很简单! (一)Maven引入依赖 注意:一定要按此版本号引入,不然会出现很多错误,包括“中文乱码、中文不输出或直接报错”等异常! <depend

 ITextPDF秒会


       最近在开发过程中,碰到了这样的需求:图片及相关文字信息,按视觉标准,排版后直接转成PDF。因为之前没接触过,乍一听很懵,感觉会很难。但经过一番网上搜索学习后,发现其实很简单!

(一)Maven引入依赖

注意:一定要按此版本号引入,不然会出现很多错误,包括“中文乱码、中文不输出或直接报错”等异常!

		<dependency>
			<groupId>com.itextpdf</groupId>
			<artifactId>itextpdf</artifactId>
			<version>5.4.3</version>
		</dependency>
		<dependency>
			<groupId>com.itextpdf</groupId>
			<artifactId>itext-asian</artifactId>
			<version>5.2.0</version>
		</dependency>
		<dependency>
			<groupId>com.itextpdf.tool</groupId>
			<artifactId>xmlworker</artifactId>
			<version>5.4.1</version>
		</dependency>
		<dependency>
			<groupId>org.jsoup</groupId>
			<artifactId>jsoup</artifactId>
			<version>1.10.1</version>
		</dependency>

(二)快速入门 —— Hello Word!

package com.netease.test;

import java.io.FileOutputStream;
import com.itextpdf.text.Document;
import com.itextpdf.text.Paragraph;
import com.itextpdf.text.pdf.PdfWriter;

public class ITextTest {
	
	public static void main(String[] args) throws Exception {
		//第一步,创建一个 iTextSharp.text.Document对象的实例:
        Document document = new Document();
        //第二步,为该Document创建一个Writer实例:
        PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("C:\\HelloWorld.pdf"));
        //第三步,打开当前Document
        document.open();
        //第四步,为当前Document添加内容;
        document.add(new Paragraph("Hello World"));  
        //第五步,关闭Document
        document.close();
        System.out.println( "OK!" );
	}

}

C盘下找找,打开你的第一个用ITextTest生成的PDF吧,就这么简单,有没有爱上它?

(三)HTML转PDF之快速入门 —— Hello Word!

1.先写一个简单的HelloWorld.html

<!DOCTYPE html>
<html>
	<head>
		<meta charset="UTF-8"/>
	<title>Insert title here</title>
	</head>
	<body>
		<h1>Hello Word!</h1>
		<h2>Hello Word!</h2>
		<h3>Hello Word!</h3>
		<h4>Hello Word!</h4>
		<h5>Hello Word!</h5>
		<h6>Hello Word!</h6>
		<h7>Hello Word!</h7>
	</body>
</html>

注:此处一定要注意,所有标签最终必须全部封闭!比如<meta charset="UTF-8"/>没有封闭,写成了<meta charset="UTF-8">。转换时,会如下错误:

Exception in thread "main" com.itextpdf.tool.xml.exceptions.RuntimeWorkerException: Invalid nested tag head found, expected closing tag meta.

2.Java代码

import java.io.FileInputStream;
import java.io.FileOutputStream;
import com.itextpdf.text.Document;
import com.itextpdf.text.pdf.PdfWriter;
import com.itextpdf.tool.xml.XMLWorkerHelper;

public class ITextTest {
	
	public static void main(String[] args) throws Exception {
	//第一步,创建一个 iTextSharp.text.Document对象的实例:
        Document document = new Document();
        //第二步,为该Document创建一个Writer实例:
        PdfWriter writer = PdfWriter.getInstance(document, new FileOutputStream("C:\\HelloWorld2.pdf"));
        //第三步,打开当前Document
        document.open();
        //第四步,为当前Document添加内容:
        //document.add(new Paragraph("Hello World"));  
        XMLWorkerHelper.getInstance().parseXHtml(writer, document, new FileInputStream("C:\\HelloWorld.html"));
        //第五步,关闭Document
        document.close();
        System.out.println( "OK!" );
	}

}

 C盘下找找,打开你的第二个用ITextTest生成的PDF,看看效果吧:


(四)直接向PDF中写入html代码

package com.netease.test;
import java.io.ByteArrayInputStream;
import java.io.FileOutputStream;
import com.itextpdf.text.BaseColor;
import com.itextpdf.text.Document;
import com.itextpdf.text.Font;
import com.itextpdf.text.FontProvider;
import com.itextpdf.text.pdf.BaseFont;
import com.itextpdf.text.pdf.PdfWriter;
import com.itextpdf.tool.xml.XMLWorkerHelper;

public class PdfTest {
	public static void main(String[] args) {
		try {
			Document document = new Document();
			PdfWriter mPdfWriter = PdfWriter.getInstance(document, new FileOutputStream("C:\\test.pdf"));
			document.open();
			String s = getHtml();
			ByteArrayInputStream bin = new ByteArrayInputStream(s.getBytes());
			XMLWorkerHelper.getInstance().parseXHtml(mPdfWriter, document, bin, null, new ChinaFontProvide());
			System.out.println("OK");
			document.close();
		} catch (Exception e) {
			e.printStackTrace();
		}
	}
	
	/**
	 * 拼写html字符串代码
	 * <p>Title: getHtml</p>
	 * @author Liyan
	 * @date   2017年4月1日 下午6:30:30
	 */
	public static String getHtml() {
		StringBuffer html = new StringBuffer();                                                                                                           
        html.append("<div>咆哮的黄河</div>");
        html.append("<div><img src='http://www.photo0086.com/member/5758/pic/2013081217201520156.JPG'/></div>");
		                                                                                                      
		return html.toString();
	}

	/**
	 * 解决中文字体
	 * <p>Title: ChinaFontProvide</p>
	 * @author  Liyan
	 * @date    2017年4月1日 下午6:30:48
	 */
	public static final class ChinaFontProvide implements FontProvider {

		@Override
		public Font getFont(String arg0, String arg1, boolean arg2, float arg3, int arg4, BaseColor arg5) {
			BaseFont bfChinese = null;
			try {
				bfChinese = BaseFont.createFont("STSong-Light", "UniGB-UCS2-H", BaseFont.NOT_EMBEDDED);
				//也可以使用Windows系统字体(TrueType)
		        //bfChinese = BaseFont.createFont("C:/WINDOWS/Fonts/SIMYOU.TTF", BaseFont.IDENTITY_H,BaseFont.NOT_EMBEDDED); 
			} catch (Exception e) {
				e.printStackTrace();
			}
			Font FontChinese = new Font(bfChinese, 20, Font.NORMAL);
			return FontChinese;
		}

		@Override
		public boolean isRegistered(String arg0) {
			return false;
		}
	}
}

 注意:IText并不是支持所有前端的标签!


C盘下找找,打开你的第三个用ITextTest生成的PDF,看看效果吧:

 

如果你还有进一步需求,想详细了解IText的强大功能,可以下载下面的两个文档,进行参考!

点击下载:

iText-手札》

iText中文文档》

 

相关文章
|
2月前
|
Java Apache Maven
Java将word文档转换成pdf文件的方法?
【10月更文挑战第13天】Java将word文档转换成pdf文件的方法?
334 1
|
3月前
|
机器学习/深度学习 算法
概率分布深度解析:PMF、PDF和CDF的技术指南
本文将深入探讨概率分布,详细阐述概率质量函数(PMF)、概率密度函数(PDF)和累积分布函数(CDF)这些核心概念,并通过实际示例进行说明。
279 15
概率分布深度解析:PMF、PDF和CDF的技术指南
|
2月前
|
存储 Java API
如何使用 Java 中的 API 更改 PDF 纸张大小
如何使用 Java 中的 API 更改 PDF 纸张大小
52 11
|
2月前
|
Java
Java PDF模板生成PDF
Java PDF模板生成PDF
49 1
|
5月前
|
JavaScript Java
Java 将Markdown文件转换为Word和PDF文档
【7月更文挑战第5天】Java中使用`Spire.Doc for Java`库可方便地将Markdown转换为Word或PDF。基本步骤包括导入模块,创建`Document`对象,加载Markdown文件,然后保存为目标格式(`.docx`或`.pdf`)。若遇到`Invalid UTF-8 stream`错误,需确保Markdown文件是UTF-8无BOM编码。页面设置可通过`PageSetup`类调整。注意,实际应用会依据具体需求和环境有所调整。
314 6
|
4月前
|
Java
JAVA PDF 截取N页,生成新文件,转图片,多个PDF 合并
JAVA PDF 截取N页,生成新文件,转图片,多个PDF 合并
90 0
|
4月前
|
XML 编解码 前端开发
wkhtmltopdf 代替 itext 将 url 转成 pdf
wkhtmltopdf 代替 itext 将 url 转成 pdf
55 0
|
5月前
|
Java API Apache
如何在Java中实现PDF生成
如何在Java中实现PDF生成
|
2月前
|
Java Apache Maven
将word文档转换成pdf文件方法
在Java中,将Word文档转换为PDF文件可采用多种方法:1) 使用Apache POI和iText库,适合处理基本转换需求;2) Aspose.Words for Java,提供更高级的功能和性能;3) 利用LibreOffice命令行工具,适用于需要开源解决方案的场景。每种方法都有其适用范围,可根据具体需求选择。
|
2月前
|
索引 Python
PDF文件页面提取操作小指南
PDF文件页面提取操作小指南
80 4