资讯专栏INFORMATION COLUMN

Python截图识字简单地完成流程

89542767 / 207人阅读

  工作上需要把繁体版转化成简体中文版手机上网找了点材料,接下来本文关键为大家介绍了有关Python完成截图识字的资料,原文中根据案例编码推荐的十分详尽,须要的小伙伴可以参考一下


  1、opencc-python


  首先介绍opencc中的Python实现库,它具有安装简单,翻译准确,使用方便等优点。对于我们日常的需求完全能够胜任。


  1.1安装opencc-python


  首先在terminal中安装opencc-python。

  pipinstallopencc-python

  1.2内建的opencc翻译配置


  这里有四种内建的opencc翻译配置:


  •t2s-繁体转简体(TraditionalChinesetoSimplifiedChinese)


  •s2t-简体转繁体(SimplifiedChinesetoTraditionalChinese)


  •mix2t-混合转繁体(MixedtoTraditionalChinese)


  •mix2s-混合转简体(MixedtoSimplifiedChinese)


  1.3简繁体转换


  importopenccPython插件/素材/.源码Q群:903971231####
  cc=opencc.OpenCC('t2s')
  print(cc.convert(u'OpenChineseConvert(OpenCC)開放中文轉換,是一個致力於中文簡繁轉換的項目,提供高質量詞庫和函數庫(libopencc)。'))


  输出结果如下:

01.png

  2、zhtools


  2.1安装


  利用Python实现汉字的简体和繁体相互转换的命令也有人开发过,并发布到github上,地址:https://github.com/skydark/nstools/tree/master/zhtools。下载该项目中的zh_wiki.py和langconv.py两个文件,放到python代码目录下就可以了。


  2.2简繁体转换


  fromlangconvimportConverter
  defconvert(text,flag=0):#text为要转换的文本,flag=0代表简化繁,flag=1代表繁化简
  rule='zh-hans'ifflagelse'zh-hant'
  returnConverter(rule).convert(text)
  text1='悄悄是别离的笙箫;夏虫也为我沉默,沉默是今晚的康桥'print(convert(text1))
  text2='悄悄是別離的笙簫;夏蟲也為我沉默,沉默是今晚的康橋'print(convert(text2,1))


  转换后的结果为:

02.png

  该方法的优点是轻量,使用方便,简洁,但可能翻译会不太准确。


  3、zhconv


  3.1zhconv安装


  zhconv库直接使用pip安装,安装命令为:


  pipinstallzhconv

  3.2使用方法


  zhconv支持以下地区词的转换:


  zh-cn大陆简体


  zh-sg马新简体(马来西亚和新加坡使用的简体汉字)


  zh-tw台灣正體(台湾正体)


  zh-hk香港繁體(香港繁体)


  zh-hans简体


  zh-hant繁體(繁体)


  方法1:直接导入zhconv1


  importzhconv
  text='此去经年,应是良辰好景虚设。便纵有千种风情,更与何人说?'
  text1=zhconv.convert(text,'zh-hant')
  text2=zhconv.convert(text,'zh-tw')
  text3=zhconv.convert(text,'zh-hk')
  print('转换为繁体:',text1)
  print('转换为台湾正体:',text2)
  print('转换为香港繁体:',text3)


  转换结果为:

03.png

  方法2:导入zhconv的convert


  fromzhconvimportconvert
  text='此去经年,应是良辰好景虚设。便纵有千种风情,更与何人说?'
  text1=convert(text,'zh-hant')
  print('转换为繁体:',text1)

04.png

  4、文档的简繁体转换


  利用扩展库python-docx,可以将Word文档中的中文进行转换,简体转换为繁体:


  pipinstallpython-docx

  这里我们使用zhconv库的方法来将word文档《匆匆》转换为《匆匆》繁体版:


  Python源码/素材/解答Q群:903971231###
  fromzhconvimportconvert
  fromdocximportDocument
  word=Document('《匆匆》.docx')
  fortinword.paragraphs:
  t.text=convert(t.text,'zh-hant')foriinword.tables:
  forpini.rows:
  forhinp.cells:
  h.text=convert(h.text,'zh-hant')
  word.save('《匆匆》繁体版.docx')

05.png

06.png

  综上所述,这篇文章就给大家介绍完毕了,希望可以给大家带来帮助。

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/128797.html

相关文章

  • 用PHP玩百万英雄类型游戏!!!

    摘要:是不是我这的问题获取二进制输出留还有另一个比较吃时间的操作是在请求百度问题,三个相关匹配一个问题匹配,这个也需要优化。 最近朋友一直再玩百万这种直播猜题的游戏,网上也搜了很多项目,基本是python的天下了。看网上的例子,说一下整体流程。 adb 截图 --> 裁剪图片只剩下题目和选项 ---> 请求百度 aip 接口 ---> 返回的题目和选项文字 ---> 再去捉取百度百度或者百度...

    joywek 评论0 收藏0
  • python学习笔记-类和实例

    摘要:面向对象最重要的概念应该就是类和实例了。记得以前学习的时候,有一个比较简单的例子来解释类和实例。构造函数类中可以定义一个构造函数。构造函数的意思就是类在创建的时候会执行的函数。在实例中通过构造函数添加的或者在类外动态添加的属性可以。 面向对象最重要的概念应该就是类(class)和实例(instance)了。记得以前学习java的时候,有一个比较简单的例子来解释类和实例。在汽车制造过程中...

    Richard_Gao 评论0 收藏0
  • Python完成简单鉴别数百个物流单号

      在我们要寄出去许多快递包裹时,为了能及时沟通物流详情,要迅速将物流单号分离出来。这时候用手动式去鉴别确实太麻烦了,因此本文用Python完成简单鉴别数百个物流单号,所需的可以了解一下  小伙伴们好,我是大五  这也是Python改变未来系列第三篇,是一个和你们相关的难题实例。  前情提要  掌握我的好朋友很有可能都清楚,阿浩常给大伙儿送书。近一年,算不上协同抽奖活动送书,独立我自买+出版社出版...

    89542767 评论0 收藏0
  • 0x01 念念Python,必有回响

    摘要:摘要灵蛇出现,必有异像,最热的领域,估计非数据分析挖掘领域莫属了。灵蛇出现,必有异像蛇有灵性,蟒蛇更甚。这便是生态圈的力量,不以个人的意志为转移。如若有心,且仔细看图识字念念不忘,必有回响真若有心于数据领域,甚或欲从事数据科学之职业。 摘要:灵蛇出现,必有异像,Python最热的领域,估计非数据分析、挖掘领域莫属了。以Scikit-Learn为代表的数据分析领域,从这里开始,便是Pyt...

    xzavier 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<