HTML转PDF的纯客户端和纯服务端实现方案

所属分类: 网页制作 / HTML/Xhtml 阅读数: 895
收藏 0 赞 0 分享

需求

用户填写表单,点击保存之后,可以直接下载pdf文档。

解决思路

服务端生成

思路

谷歌浏览器在17年自行开发了Chrome Headless特性,并与之同时推出了 puppeteer,它可以被理解为是无界面但是可以完成服务器功能特性的浏览器。

所以我们可以在服务端启动puppeteer浏览器,打开目标网址,使用chrome浏览器自带的转换功能进行html到pdf的转换。

服务端生成核心代码

首先要安装puppeteer,npm安装可能会出错,最好使用cnpm淘宝镜像安装。

输入 cnpm i puppeteer -S 安装依赖。

创建一个js文件,只需要用puppeteer浏览器打开网址,保存pdf即可。

// html2pdf.js

const puppeteer = require('puppeteer');
(async function(){
    // 启动服务
    const browser = await puppeteer.launch();
    // 打开标签页
    const page = await browser.newPage();
    // 转到该地址
    await page.goto('https://koa.bootcss.com/#context');
    // html页面转pdf并保存至path
    await page.pdf({path:"test.pdf",format:'A4'})
    // 关闭浏览器
    await browser.close();
})();

然后控制台输入 node html2pdf.js 启动服务。

当然也可以module.export将模块方法导出,根据业务逻辑来。

缺点

无法保存表单动态数据

由于是从服务端请求页面,如果不在请求地址上保存用户输入,截出来的pdf将是页面没被填写的初始状态。

换而言之,他只能进行静态页面的转换,因为我们的需求有大量用户输入,因此pass。

客户端生成核心代码

思路

  • 使用html2canvas,输入需要转换的dom节点,遍历转换成canvas画布
  • 将canvas画布转成base64图片,使用jsPDF创建pdf文件,把图片插入进pdf。

缺点

失真。

我们可以很明显的发现,既然是类似于对页面截图再将截图插入pdf,页面的分辨率和配置很可能影响输出图片的质量。

同时,因为是截图,可能失去页面链接等功能。

文字截断

当canvas画布大于pdf一页大小时,输出就会出错,这时我们需要判断canvas画布是否超出A4大小,如果超出,对canvas进行分割,插入到不同的页面。

这时候问题又来了,既然是分割图片,那么很可能导致图片或者文字从一半就被截断,因为我们无法分析canvas内部item的结构。

核心代码

我们的需求没有图片和链接,所以失真的问题对我们影响不大,同时我们的表单由多个重复等长的item组成,并且这些item都非常短,不会超出一张A4纸(虽然这样不严谨,如果需要,你可以获取DOM元素宽高,根据DOM元素高度裁剪)。

所以我打算直接根据item切分canvas,每个item给一页A4纸保存。

在开始之前需要理解几个核心方法:

html2canvas

   // DOM是要转换的DOM节点
    html2canvas(DOM,{
        backgroundColor:"#ffffff",
        width:width,
        height:height,
        scale:2,
        allowTaint:true,
    }).then((canvas)=>{
        // canvas 是转换成功后的画布
    })

jsPDF

   // 创建实例
    let pdf = new jsPDF('','pt','a4');
    // 将图片添加到pdf文件里
    // 第一个参数是待插入的文件(base64)格式,第二个是文件格式
    // 第三第四是图片左上角的坐标,最后两个是图片插入后的宽高
    pdf.addImage(image,'JPEG',10,10,height,width);
    // 添加新的一页
    pdf.addPage()
    // 保存pdf文件
    pdf.save()

canvas

  // canvas是待剪切的图片
    // sx,sy是开始裁剪的坐标
    // swidth、sHeight是裁剪的宽高
    // dx、dy是裁剪后图像在canvas中插入的坐标
    // sWidth,sHeight是裁剪后图像在canvas中的宽高
    cxt.drawImage(canvas,sx,sy,sWidth,sHeight,dx,dy,sWidth,sHeight);
/**
 * @description: 表单转pdf文件
 * @return: pdf
 */
onSubmit(){
    // 这是我要转换的表单,里面有很多一样的表格
    let form = this.$refs.form;
    // 获取元素的宽高
    let width = form.getBoundingClientRect().width;
    let height = form.getBoundingClientRect().height;
    html2canvas(form,{
        backgroundColor:"#ffffff",
        width:width,
        height:height,
        scale:2,
        allowTaint:true,
    }).then((canvas)=>{
        let pdf = new jsPDF('','pt','a4');
        // 进行图片切割
        let canvasList = this.splitCanvas(canvas,this.forms.length);

        // 遍历canvas列表,每页添加一张图片
        canvasList.forEach((item,index)=>{
            // 转换图片格式为base64
            let itemImage = item.toDataURL('image/jpeg',1.0);
            // 预留10px边距,A4纸的宽在72分辨率的显示器上是595px
            pdf.addImage(itemImage,'JPEG',10,10,575.28,575.28/item.width*item.height);
            // 如果不是最后一页,则分页
            index == this.forms.length-1 ? '' : pdf.addPage();
        })
        // 文件保存
        let blob = pdf.output('blob');
        
        pdf.save('test.pdf');
    })
},
/**
 * @description: 对canvas进行切割
 * @param {number} num 切片数量 
 * @param {canvas} canvas 
 * @return {array} canvas列表
 */
splitCanvas(canvas,num){
    let height = canvas.height,width = canvas.width;
    let chunkHeight = height/num;// 每个切片的高度
    let chunkList = [];// 存放结果canvas
    for(let i=0; i<height ; i+=chunkHeight){
        // 初始化裁剪矩形框位置
        let sx = 0,sy = i,sWidth = width,sHeight = chunkHeight,dx = 0, dy = 0;
        // 创建一个canvas节点
        let canvasItem =document.createElement("canvas");
        // 初始化画布大小
        canvasItem.height = chunkHeight;
        canvasItem.width = width;
        let cxt = canvasItem.getContext("2d");
        // 将裁剪的图片放到新的canvas节点
        cxt.drawImage(canvas,sx,sy,sWidth,sHeight,dx,dy,sWidth,sHeight);
        chunkList.push(canvasItem); 
    }
    return chunkList;
},

最终效果

表单保存后的页面

转换成pdf的效果

 到此这篇关于HTML转PDF的纯客户端和纯服务端实现方案的文章就介绍到这了,更多相关HTML转PDF内容请搜索脚本之家以前的文章或继续浏览下面的相关文章,希望大家以后多多支持脚本之家!

更多精彩内容其他人还在看

网页注释在IE中产生文字溢出

实验代码如下: <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional//EN" "http://www.w3.org/TR/xhtml1/DTD/xhtml1-transiti
收藏 0 赞 0 分享

HTML教程:定义列表

原文:http://andymao.com/andy/post/104.html 上一节:有序列表 写完“无序列表”和“有序列表”之后已经有人和我说这两篇看得没什么意思。这两篇文章如果只以单向读取的形式阅读那么的确是没什
收藏 0 赞 0 分享

HTML教程:有序列表

原文:http://andymao.com/andy/post/103.html 上一节:无序列表 信息有时候是无序归纳的,有的却有着明确的顺序,在上一篇也提到了。那么简单的来想一下身边有哪些事物是有先后顺序的:操作步骤、排行榜、书目录……
收藏 0 赞 0 分享

HTML教程:无序列表

原文:http://andymao.com/andy/post/102.html 段落已经讲完了,那么一些基本的应用方式也讲了一些,那么是否已经应用了呢?当然应用可以更为丰富,那么这些就需要自己在实际工作中不断的摸索与思考,然后创新并总结得出新的应用形式。当然了段落不能当作
收藏 0 赞 0 分享

HTML网页制作的强大8条技巧

  虽然现在有许多网页制作工具能让您轻松地完成工作,但如果使用HTML则可以得到更大控制权,下面介绍几个小技巧。   1。使用<tt>,<i>,<br>语句来控制文字排版比用<pre>好得多。 如: <tt>实用
收藏 0 赞 0 分享

网页表格分割线去除方法

网页表格分割线去除方法。 其实上面的三个表格都有三行三列,隐藏分隔线的诀窍在于rules,察看这三个表格的源代码,我们可以看到<TABLE>标签中都有rules。它有三个参数(cols,rows,none),当rules=cols时,表格会隐藏纵向的分隔线,这
收藏 0 赞 0 分享

blockquote标记应用注意

关于语义化,不是一句两句就能说明白的,而且现在也没有一个官方的很严格的定义。关于<blockquote>没有争议的是: 1.引用一段较长的文字 2.可以使用cite标签或者属性 问题是<blockquote>引用的文字必须使用块级元素将他
收藏 0 赞 0 分享

网页表格表框制作技巧

网页表格表框制作技巧。 -------------------------------------------------------------------------------- 表格边框的显示与隐藏,是可以用frame参数来控制的。请注意它只控制表格的边框图,而不
收藏 0 赞 0 分享

HTML其实就是学习几个重要标记的应用

《这将是一场革命》一文出来以后。得到业界大伙的认同,当然与此同时也得到部分来自内部与外部的挑衅,不过的更加多的是更多人来寻问每一个点的细节。今晚回家很早就睡了,半夜在一个梦中醒来,梦里正在和小学的同学玩一个游戏——“The Next&rdquo
收藏 0 赞 0 分享

移动端专用的meta标签设置大全

不知道有没有人觉得,html的meta标签描述的头部信息特别多,下面这篇文章主要给大家分享介绍了关于移动端专用的meta设置的相关资料,文中通过示例代码介绍的非常详细,需要的朋友可以参考借鉴,下面随着小编来一起学习学习吧
收藏 0 赞 0 分享
查看更多