资讯专栏INFORMATION COLUMN

付费?不存在的,20 行代码将电子书转换为有声小说

yzd / 1263人阅读

摘要:既然要将电子书转换为语音文件,那么第一步要解决的问题就是将电子书中的文字解析出来,这个可以用库来解决。安装读取内容之所以强大就是因为有很多各种各样的库给你用,读取内容只需三行代码即可搞定,刚好手里有本欺骗的艺术一起来看看。

文 | 豆豆

来源:Python 技术「ID: pythonall」

类似得到电子书或者樊登读书会等平台,现在都可以直接听书了,而且声音方面听起来非常舒服,但无一例外,这些平台都需要购买会员,作为技术人的我简直不能忍,于是尝试自己动手丰衣足食。

既然要将电子书转换为语音文件,那么第一步要解决的问题就是将电子书中的文字解析出来,这个可以用 pdfplumber 库来解决。

安装

pip3 install pdfplumber

读取 PDF 内容

Python 之所以强大就是因为有很多各种各样的库给你用,读取 PDF 内容只需三行代码即可搞定,刚好手里有本「欺骗的艺术」一起来看看。

重点看第四页的内容即可,接下来就直接用 pdfplumber 来读取第四页内容。

with pdfplumber.open("欺骗的艺术.pdf") as pdf:    page = pdf.pages[3]    text = page.extract_text()    print(text)

看下输出日志:

从日志中可以看出转换还是相当精准的。

文字转音频

文字转音频是使用的 pyttsx3 库,直接安装使用即可。

pip3 install pyttsx3

正式转换之前呢先做一个简单的测试,看看是否可以正确将文字朗读出来。

import pyttsx3def read_by_mp3(text):    engine = pyttsx3.init() # 初始化语音引擎    text = text.replace("/n", "") # 去掉换行符    engine.say(text) # 读文本    engine.runAndWait()if __name__ == "__main__":    read_by_mp3("一些黑客毁坏别人的文件甚至整个硬盘,他们被称为电脑狂人")

该函数会直接将文本内容读出来,当然你也可以选择下载保存音频文件到本地。

import pyttsx3def read_by_mp3(text):    engine = pyttsx3.init() # 初始化语音引擎    text = text.replace("/n", "") # 去掉换行符    engine.save_to_file(text, "text.mp3") # 保存音频文件到本地    engine.runAndWait()

效果如下:

音频整体听起来还是非常流畅的,只是少了些许感情,剩下的流程派森酱就不再赘述啦,无非就是获取到 PDF 所有的内容,然后调用 read_by_mp3 函数就可以啦。

总结

今天派森酱带领大家试着通过语音朗读的方式来读取 PDF 内容,整体流程已经跑通,而且效果比较顺畅,商业化估计有点不够要求,但还是可以考虑做一些小工具的,毕竟免费嘛。

PS:公号内回复「Python」即可进入Python 新手学习交流群,一起 100 天计划!

老规矩,兄弟们还记得么,右下角的 “在看” 点一下,如果感觉文章内容不错的话,记得分享朋友圈让更多的人知道!

代码获取方式

识别文末二维码,回复:豆豆

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/121817.html

相关文章

  • 一个Android音频文本同步英文有声读物App开发过程

    摘要:新概念英语可可英语亚马逊的有声书扇贝听力是我目前所知道的实现英文语音和文本同步的应用。这里是的源码这里是制作的开源命令行工具版权声明一个音频文本同步的英文有声读物的开发过程由在年月日写作。 新概念英语、可可英语、亚马逊的audible有声书、扇贝听力是我目前所知道的实现英文语音和文本同步的应用。同步包括两方面: 被读到的单词(或句子)可以高亮显示,同步显示文本; 选中某个单词(或句子...

    andot 评论0 收藏0
  • 重磅:小程序服务范围大调整!社交、直播都能做了

    在小程序正式发布(1月9日)前的这几天,微信调整了小程序的服务类目。调整后最新的服务范围如下:showImg(https://segmentfault.com/img/bVHUhd?w=800&h=589); 2016年的两大热门领域 —— 直播和共享都出现在了新的服务类目中先看大类,相比最初的版本: 删除了休闲娱乐,变成「生活服务」下的小类 新增了社交、体育、商家自营 电商更改为「电商平台」,快...

    darkbaby123 评论0 收藏0
  • 云计算后现代主义思考

    摘要:技术的现代主义通过这种方式,所有基于云计算的技术都是技术现代主义。为什么这一切不能在云端进行云计算后现代主义的思考当一切的答案都是一回事时,批判性思维需要一条新的道路。云计算后现代主义意味着在人们质疑传统智慧的过程中也应用了新的范例。近年来,很多企业已经将其业务迁移到云计算平台。有人称这种迁移是一种现代淘金热,这并非没有道理。很多组织的首席执行官正在主导实施数字化转型,揭示了信息作为组织生命...

    james 评论0 收藏0
  • 佛系程序员月薪五万指南

    摘要:大师错,这是你的第二个误区碎片时间碎片学习青年这有什么问题吗知乎朋友圈头条很多文章我看起来都很有道理啊,而且学的很快大师标题党震惊党鸡汤文养生文我有一个朋友文。。。。。。 摘要: 大师:很简单,我这里有一份佛系月薪 5 万指南,我看你骨骼清奇、脑门光亮,一看就是将要大富大贵之人,这份指南可以助你快速实现小目标! showImg(https://segmentfault.com/img/...

    HmyBmny 评论0 收藏0
  • 佛系程序员月薪五万指南

    摘要:大师错,这是你的第二个误区碎片时间碎片学习青年这有什么问题吗知乎朋友圈头条很多文章我看起来都很有道理啊,而且学的很快大师标题党震惊党鸡汤文养生文我有一个朋友文。。。。。。 摘要: 大师:很简单,我这里有一份佛系月薪 5 万指南,我看你骨骼清奇、脑门光亮,一看就是将要大富大贵之人,这份指南可以助你快速实现小目标! showImg(https://segmentfault.com/img/...

    crossea 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<