资讯专栏INFORMATION COLUMN

Python中文繁简体转换工具

SimonMa / 521人阅读

Openccpy
  ___   _____      __    ___     ___    ___   _____   __  __
 / __`/ "__`  /"__`/" _ `  /"___ /"___/ "__`/ / 
/ L   L /  __// / / \__// \__/  L   \_ 
 \____/  ,__/ \____ \_ \_ \____ \____  ,__//`____ 
 /___/    /  /____//_//_//____//____/   /  `/___/> 
           \_                                  \_     /\___/
           /_/                                  /_/     /__/

OpenccPy 是一款 python 中文繁简体转换工具。

特性

支持中文繁简体转换

Quick Start 环境要求

Python 3.X

install
pip install openccpy
使用案例
# coding=utf-8
from openccpy.opencc import *

class TestOpencc(object):
    """
    核心转换测试类
    """

    def test_to_simple(self):
        """
        测试转换为简体
        """
        assert "丝" == Opencc.to_simple("絲")
        assert "一目了然" == Opencc.to_simple("一目瞭然")

    def test_to_traditional(self):
        """
        测试转化为繁体
        """
        assert "絲" == Opencc.to_traditional("丝")
        assert "一目瞭然" == Opencc.to_traditional("一目了然")
方法简介 转为简体
def to_simple(traditional):
     """
     繁体转化为简体
     1. 如果字符为空,直接返回
     2. 字符长度为1,返回对应简体字符
     3. 对应长度大于1,返回对应简体词组
     :param traditional: 繁体单词/单个词组
     :return: 对应的简体信息
     """
转为繁体
def to_traditional(simple):

    """
    简体转化为繁体
    1. 如果字符为空,直接返回
    2. 字符长度为1,返回对应繁体字符
    3. 对应长度大于1,返回对应繁体词组
    :param simple: 简体单词/单个词组
    :return: 对应的繁体信息
    """
相关框架

中文繁简体转换-java 版本

源码地址

github/openccpy

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/43571.html

相关文章

  • 中文维基百科文本数据获取与预处理

    摘要:下载数据方法使用官方的数据最新打包的中文文档下载地址是。中文维基数据繁简混杂大家都说存在这个问题,但的网站是将繁体中文和简体中文分开处理的,所以一直觉得从数据库到结构都应有方法将两者区分开,暂罢,待有空研究其数据时再议。 照例,先讲下环境,Mac OSX 10.11.2 ,Python 3.4.3。 下载数据 方法1:使用官方dump的xml数据 最新打包的中文文档下载地址是:http...

    loostudy 评论0 收藏0
  • java 中文简体转换工具 opencc4j

    摘要:创作缘由对于中文的繁简体转换是一种很常见的需求。存在一个严重的问题特殊词组的转换可能存在问题。是一款非常优秀的转换工具。使用方式引入转为简体生命不息,奮鬥不止结果为生命不息,奋斗不止转为繁体生命不息,奋斗不止结果为生命不息,奮鬥不止 创作缘由 对于中文的繁简体转换是一种很常见的需求。 但是很多工具类都是简单的做个映射。(使用map,集合,properties)等。 存在一个严重的问题:...

    nodejh 评论0 收藏0
  • Python截图识字简单地完成流程

      工作上需要把繁体版转化成简体中文版手机上网找了点材料,接下来本文关键为大家介绍了有关Python完成截图识字的资料,原文中根据案例编码推荐的十分详尽,须要的小伙伴可以参考一下  1、opencc-python  首先介绍opencc中的Python实现库,它具有安装简单,翻译准确,使用方便等优点。对于我们日常的需求完全能够胜任。  1.1安装opencc-python  首先在terminal...

    89542767 评论0 收藏0
  • Python2.x 字符编码终极指南

    摘要:值得注意的是,有的编码方案不一定能表示某些信息,这时编码就会失败,比如就不能用来表示中文。数组的每一项是一个字节,用来表示。所以对于字符串来说,其长度等于编码后字节的长度。所以,让来编码解码中文,就超出了其能力范围。 在人机交互之字符编码 一文中对字符编码进行了详细的讨论,并通过一些简单的小程序验证了我们对于字符编码的认识。但仅了解这篇文章的内容,并不能帮我们在日常编程中躲过一些字符编...

    Amio 评论0 收藏0
  • 基于gensim的Wiki百科中文word2vec训练

    摘要:而腾讯和宝马保时捷,网易和宝马保时捷将会离得较远一些。关于的使用方法,可以参考基于的实践。下面我们分别查看同宝马和腾讯最相近的前个词语。可以发现和宝马相近的词大都属于汽车行业,而且是汽车品牌和腾讯相近的词大都属于互联网行业。 Word2Vec简介 Word2Vec是词(Word)的一种表示方式。不同于one-hot vector,word2vec可以通过计算各个词之间的距离,来表示词与...

    stdying 评论0 收藏0

发表评论

0条评论

SimonMa

|高级讲师

TA的文章

阅读更多
最新活动
阅读需要支付1元查看
<