资讯专栏INFORMATION COLUMN

java 中文繁简体转换工具 opencc4j

nodejh / 2940人阅读

摘要:创作缘由对于中文的繁简体转换是一种很常见的需求。存在一个严重的问题特殊词组的转换可能存在问题。是一款非常优秀的转换工具。使用方式引入转为简体生命不息,奮鬥不止结果为生命不息,奋斗不止转为繁体生命不息,奋斗不止结果为生命不息,奮鬥不止

创作缘由

对于中文的繁简体转换是一种很常见的需求。

但是很多工具类都是简单的做个映射。(使用map,集合,properties)等。

存在一个严重的问题:特殊词组 的转换可能存在问题。

OpenCC

OpenCC 是一款非常优秀的转换工具。但是没有直接提供 Java 便于使用的 jar。

opencc4j

opencc4j 就是在上面的工具基础上提供的 java 使用版本。

opencc4j 使用方式 maven 引入

    com.github.houbb
    opencc4j
    1.0.2
转为简体
String original = "生命不息,奮鬥不止";
String result = ZhConverterUtil.convertToSimple(original);

结果为

生命不息,奋斗不止
转为繁体
String original = "生命不息,奋斗不止";
String result = ZhConverterUtil.convertToTraditional(original);

结果为

生命不息,奮鬥不止

文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。

转载请注明本文地址:https://www.ucloud.cn/yun/76447.html

相关文章

  • NLP 开源形近字算法补完计划(完结篇)

    摘要:本文将作为汉字相似度的完结篇,为该系列画上一个句号。起中文形近字相似度计算思路承中文形近字相似度算法实现,为汉字尽一点绵薄之力转当代中国最贵的汉字是什么不足之处之所以有本篇,是因为上一次的算法实现存在一些不足。 前言所有的故事都有开始,也终将结束。本文将作为 NLP 汉字相似度的完结篇,为该系列画上一个句号。起...

    番茄西红柿 评论0 收藏2637
  • Python中文简体转换工具

    Openccpy ___ _____ __ ___ ___ ___ _____ __ __ / __`/ __` /__`/ _ ` /___ /___/ __`/ / / L L / __// / / \__// \__/ L \_ \____/ ,__/ \____ \_ \_ \____ \____ ,__//`__...

    SimonMa 评论0 收藏0
  • 中文维基百科文本数据获取与预处理

    摘要:下载数据方法使用官方的数据最新打包的中文文档下载地址是。中文维基数据繁简混杂大家都说存在这个问题,但的网站是将繁体中文和简体中文分开处理的,所以一直觉得从数据库到结构都应有方法将两者区分开,暂罢,待有空研究其数据时再议。 照例,先讲下环境,Mac OSX 10.11.2 ,Python 3.4.3。 下载数据 方法1:使用官方dump的xml数据 最新打包的中文文档下载地址是:http...

    loostudy 评论0 收藏0

发表评论

0条评论

最新活动
阅读需要支付1元查看
<