资讯专栏INFORMATION COLUMN

强烈推荐这款神器,把网站转pdf还能编程高级定制!【建议收藏】

UsherChen / 682人阅读

摘要:第二步,验证一下,把百度生成打开任意一个终端,运行下面的脚本。这里雷学委直接把百度首页保持为保持内容为图片如下图所示,这个软件不止生成文件,还能生存图片。第三步,高级定制。高级定制参考上面的代码。

学委之前写过一篇把热榜保存为html文件的,这次利用上次写的部分代码继续拓展:生成pdf文件。

我们需要的就是这个软件: wkhtmltopdf

它做的事就一件很专注:网页html生成 pdf (或者图片)

第一步,下载安装

打开官网:https://wkhtmltopdf.org/

下载苹果电脑的pkg文件。

学委用的是苹果电脑,下载的是下面这个软件。

点击下一步一步的,默认设置就好。

第二步,验证一下,把百度生成pdf

打开任意一个终端,运行下面的脚本。

#这里雷学委直接把百度首页保持为pdfwkhtmltopdf https://baidu.com baidu.pdf#保持内容为图片wkhtmltoimage https://baidu.com baidu.png

如下图所示, wkhtmltopdf 这个软件不止生成pdf文件,还能生存图片。

随便找个文章链接就能保存为pdf

比如把学委的文章保存为pdf

wkhtmltopdf https://blog.csdn.net/geeklevin/article/details/120073157/?spm/=1001.2014.3001.5501 leixuewei.01.pdf

保存的pdf文件如下:

这个软件就是直接把整个网页变成pdf,原样保存。

第三步,高级定制。用python来定制生成pdf

这里把前面文章 ❤️爬虫截热榜长屏不方便阅读!推荐dominate直接生成报告❤️ 把里面的report.py 复制一下。

1 先安装下面的依赖

pdfkitdominate

2 编写下面的代码定制网页来实现pdf定制

然后编写下面的代码,调用report.py 生成表格页面,保存为html

#!/usr/bin/env python# -*- coding: utf-8 -*-# @Time : 2021/9/4 8:38 下午# @Author : LeiXueWei# @CSDN/Juejin/Wechat: 雷学委# @XueWeiTag: CodingDemo# @File : pdf_demo.py# @Project : pydocsimport pdfkitimport report # PDF中包含的文字lxw_tuples = []lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11143102.html?spm=1001.2014.3001.5482","雷学委趣味编程故事汇编"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11235756.html","编程新手指南"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10980215.html","Python从入门到精通"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11159040.html","学会Python等于拥有整个世界!"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11253201.html","沉住气学习爬虫"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11099259.html","架构运维"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10461966.html","雷学委之NodeJS爱好系列"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10532880.html","雷学委的DevOps一条龙"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_11291617.html","LINUX程序员都要懂"))lxw_tuples.append(("https://blog.csdn.net/geeklevin/category_10725914.html","[小白向Linux基操]"))# 调用之前热榜保存为html文章的generate_html,根据专栏数据生成html页面代码#https://blog.csdn.net/geeklevin/article/details/119657231?spm=1001.2014.3001.5501 内实现的report.py脚本的generate_html函数html = report.generate_html(lxw_tuples)# 这里雷学委把html源代码转换为PDFpdfkit.from_string(html, "./leixuewei_zhuanlan.pdf")

效果如下:

延伸

多数情况下,我们可以使用wkhtmltopdf来直接把链接直接保存为pdf文件。

pdf高级定制参考上面的代码。从上面的代码,我们可以看出,pdfkit可以根据任意的html代码来生成pdf。

对了,想要学习的现在立马点击链接加入打开学习Python全栈技术学习交流】:

所以只要去找一些好看的html网页模板,进行调整既可以生成各种款式的pdf文件。

喜欢Python的朋友,请关注学习 Python基础专栏 or Python入门到精通大专栏

持续学习持续开发,我是雷学委!
编程很有趣,关键是把技术搞透彻讲明白。
创作不易,请关注收藏点赞,或者留下评论打打气!

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/119410.html

相关文章

  • 从小白程序员一路晋升为大厂高级技术专家我看过哪些书籍?(建议收藏

    摘要:大家好,我是冰河有句话叫做投资啥都不如投资自己的回报率高。马上就十一国庆假期了,给小伙伴们分享下,从小白程序员到大厂高级技术专家我看过哪些技术类书籍。 大家好,我是...

    sf_wangchong 评论0 收藏0
  • 最强GAN修图魔术师:美颜生发摘眼镜、草绘秒变真人脸

    摘要:该研究成果由韩国团队发表于论文地址训练数据恰当的训练数据有助于提高网络训练性能。在将损失函数应用于输入图像之前,用输入图像替换了掩模外部的图像的剩余部分。总体损失函数如下其中,发生器用进行训练,鉴别器用进行训练。 为一个设计师,是否整天因为繁琐枯燥的修图工作不胜其烦?现在,一款基于GAN的AI修图大师可以将你从这类工作中解放出来。修轮廓、改表情、生发、加耳环、去眼镜、补残图,你能想到的它都能...

    xialong 评论0 收藏0
  • Sublime Text 特色插件推荐,持续更新!

    摘要:不过建议只用来进行系语言的语义分析,因为有,有类更好的语法高亮,类似的还有,选一个就好了。从目前的使用情况来看,部分实现了,比如自动完成和语法高亮,以及用的检查格式。管理文档的语法高亮。 自从接触到了sublime text,感觉确实是越用越好用,几乎所有和文字编辑有关的都离不开它。这一年多搜集了不少插件,不敢独享,拿出来和大家同乐。我用的是Sublime Text 3, 以下所有的插...

    Jensen 评论0 收藏0
  • 分享一些实用的软件工具

    摘要:分享一些实用的软件工具也可以分享自己常用的软件给大家,这里会同步更新必备放几个资源站点有能力建议购买正版不要看格式的,可以是。建议使用清除系统的间谍软件,用了之后夏一跳,赶紧卸载了迅雷极速版,只用精简版。 分享一些实用的软件工具 PS:也可以分享自己常用的软件给大家,这里会同步更新 kindle(必备) 放几个azw3资源站点:有能力建议购买正版,不要看PDF格式的,可以是mobi。我...

    arashicage 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<