摘要:亚洲包括中文日文和韩文的语言自动检测和输出增加了其先进的光学字符识别功能。语言支持亚洲支持横向和纵向文字的亚洲语言。此功能可以帮助你的业务在亚洲市场取得成功。目前该功能仅适用于。
ImageGear for .NET是一款图形图像处理控件,可以轻松地为程序添加扫描/压缩/条形码识别/PDF/文件查看与处理/图形编辑与处理等功能。具有扫描,压缩,浏览、添加注释,打印,图像编辑,OCR以及PDF和矢量图像支持,使开发人员可以快速地开发出图像处理程序,可用于.NET Framework2.0、3.0、3.5、4.0,ASP.NET,WPF,SilverLight,DirectX 10和Direct3D 10。支持超过100种图片格式,包含:TIFF, JPEG, CAD, Vector, 3D PDF, PDF/A, PS等。
最新版本的ImageGear.NET v23,为开发人员提供了新的AcroForm功能;将亚洲光学字符识别(OCR)输出添加到PDF,通过将中文、日文和韩文OCR输出结合到PDF中,扩大了适应性和在全球无缝创建PDF的能力;并通过合规性检查加强了PDF/A转换。
新增功能
PDF AcroForms——创建、读取和写入PDF表单字段和数据
1、高级AcroForms SDK提供强大的表单功能: .NET开发中AcroForms SDK *可以将AcroForm字段添加、更新或删除到新的或现有的PDF中。这为你的用户提供从表单域读取和写入数据的方式,而无需离开你的网站或应用程序。如果他们需要更新现有的PDF,SDK会通过注释工具提供帮助。 2、使用表单增强你的应用程序: 需要让你的用户访问数字表单?预先填充表单域允许用户直接从你的网站或应用程序将数据写入表单。将表单字段添加到PDF,包括: · 复选框 · 文本字段 · 列表框 · 组合框 · 状态设置框 3、ImageGear还允许低级别访问PDF,以便用户可以直接从你的网站或应用程序访问任何文档或AcroForm。
亚洲OCR——包括中文、日文和韩文的语言自动检测和PDF输出
ImageGear增加了其先进的光学字符识别功能。ImageGear支持亚洲语言,提供中文、日文和韩文的OCR。 1、语言支持 亚洲OCR支持横向和纵向文字的亚洲语言。支持的语言有: · 传统中文 · 简体中文 · 日语 · 韩语 2、自动语言检测技术 ImageGear使用自动语言检测技术来完成文档的OCR,包括含有亚洲语言的文档。此功能可以帮助你的业务在亚洲市场取得成功。 3、亚洲OCR输出格式 通过使用所有识别信息(字体细节、定位的图像区域和识别的表格结构信息)来创建格式化的输出,以重述原始文档的含义。亚洲版利用OCR引擎的强大功能,用亚洲语言创建文档图像的强大格式化输出。 4、亚洲版输出格式: · TXT · Word · Excel · HTML · PDF
功能增强
OCR——改进OCR布局、分区顺序和文档
ImageGear OCR可用于Windows上的多种平台和语言,包括C,C ++,C#和其他.NET语言。ImageGear提供超过100种语言的全页光学字符识别(OCR),包括西方和亚洲语言如中文、日文和韩文。ImageGear的自动语言检测功能使OCR功能完善。 OCR可作为附件购买,为应用程序开发提供完整的文档图像库。我们的C#OCR SDK: · 包括100多种不同的语言 · 检测并读取中文、韩文和日文 · 识别单个图像中的多种语言的字符 · OCR样本可用于C#,VB.NET,C和C ++ 1、全页OCR · 通过我们的自动分区和细分功能,你的用户可以: · 将页面自动分割为各个区域进行处理 · 根据流程、表格或图形将类型分配给定位的区域 · 用先进技术检测表格,改善数据结果重构 · 处理页面的全幅图像或单个区域 · 由用户定义区域,从文件加载或由引擎自动检测 2、最大精度的图像预处理 OCR之前会发生什么?看看OCR的预处理步骤: · 高级图像处理方法可用于提高OCR精度 · 自动反转功能检测图像是否需要反转以获得最高精度 · 自动图像方向检测和调整图像 · 纠错方法检测图像并自动校正,提高分割和识别精度 · 去斑方法去除图像捕获过程中的污点和缺陷 · 分辨率增强提高了低分辨率图像的质量 3、预定义和可定制的字典 ImageGear的OCR在扫描文档时使用预定义的字典和数据字典。ImageGear使用17种不同语言的高级拼写检查,每种语言都在特定字典中。17个词典中的每一个都包含100,000到200,000个条目。垂直字典可以改善医疗和法律行业的拼写检查和OCR准确性。 4、卓越的结果处理 ImageGear OCR引擎以Unicode格式处理所有数据。可以为具有多个输出选项的特定代码页格式化数据输出,如: · PDF上的图像 · 基于文本的PDF · Microsoft Office 2007 · Microsoft Office 97(Word,Excel和Powerpoint) · RTF · HTML · XML 5、OCR版本:ImageGear的功能选项 ImageGear有三个不同的功能选项。三个选项之间的主要区别是OCR引擎创建的输出格式。你的开发选项如下: a、标准版 标准版为西方语言(如英语)创建输出格式。标准版仅输出文本文件并生成PDF。它包括的文件格式是可搜索的文本PDF和文本文档。 b、标准版Plus 标准版本Plus为西方语言(如英语)创建格式化输出。使用识别技术创建格式化的输出,以识别字体细节、定位图像区域并识别表格结构以创建原始文档。它包括的文件格式有Word、Excel、HTML、可搜索的PDF和文本文档。 c、亚洲版 亚洲版为亚洲语言(如中文,日语和韩语)创建格式化的输出。这种格式化的输出是使用与标识字体相同的识别技术来创建的,它标识字体细节、定位图像区域,并识别表格结构。格式包括Word、Excel、HTML、可搜索的PDF和文本文档。 *目前该功能仅适用于ImageGear for .NET。
PDF/A——丰富的PDF/A,并具有PDF/A转换的合规性检查
1、将PDF文件转换成PDF/A文件 PDF/A是一种ISO标准类型的PDF文件,用于存档和长期保存文件,以便它们能够与原始文件完全一致。元素(如字体)必须是独立的或嵌入的,以保留原始文件的格式和属性。PDF/A已经在欧洲流行,在美国正成为更广泛使用的文件格式。 2、ImageGear PDF/A特点: · 根据光栅图像文件和扫描的图像创建PDF/A文件 · 验证PDF/X(PDF/X-1a,PDF/X-3和PDF/X-4)和PDF/A(PDF/A-1a和PDF/A-1b)合规性的PDF文件 · 将不合格的PDF文件转换为符合PDF/A-1b的PDF文件 · 新的增强功能可以改善从PDF到PDF / A的合规检查和转换过程 *目前PDF到PDF/A转换仅在ImageGear .NET中可用。
文章版权归作者所有,未经允许请勿转载,若此文章存在违规行为,您可以联系管理员删除。
转载请注明本文地址:https://www.ucloud.cn/yun/110469.html
摘要:与介绍将图片翻译成文字一般被称为光学文字识别,。是目前公认最优秀最精确的开源系统。我们以图片为例输入命令识别结果如下只识别错了一个字,识别率还是不错的。最后加一句,对于彩色图片的识别效果没有黑白图片的效果好。 OCR与Tesseract介绍 将图片翻译成文字一般被称为光学文字识别(Optical Character Recognition,OCR)。可以实现OCR 的底层库并不多,...
摘要:随着深度学习的兴起,有学者提出用深度学习相关算法对扭曲文档图像进行矫正。考虑到实际业务的复杂性,传统方法无法胜任,因此本文结合深度学习语义分割领域的相关知识,针对现有方法的不足提出优化方案,实现扭曲文档的矫正。 一、背景 随着集团业务的高速发展以及集团对用户群体信用要求的提高,证件审核成为业务中必不可少的一个环节。譬如:支付宝需要对用户的身份证信息进行审核,1688需要对卖家的营业执照...
摘要:随着深度学习的兴起,有学者提出用深度学习相关算法对扭曲文档图像进行矫正。考虑到实际业务的复杂性,传统方法无法胜任,因此本文结合深度学习语义分割领域的相关知识,针对现有方法的不足提出优化方案,实现扭曲文档的矫正。 一、背景 随着集团业务的高速发展以及集团对用户群体信用要求的提高,证件审核成为业务中必不可少的一个环节。譬如:支付宝需要对用户的身份证信息进行审核,1688需要对卖家的营业执照...
摘要:科普一下什么是时区众所周知地球绕着太阳转的同时也会自转因此同一时刻不同地区所接收到太阳照射的情况不同所以有的地区是日出有的地区是日落还有的地区可能是黑夜既然地球上的不同地区时间不同那总要有统一的时间刻度才能方便文化科技交流吧不然大家说的都是 科普一下什么是时区 众所周知,地球绕着太阳转的同时也会自转,因此同一时刻不同地区所接收到太阳照射的情况不同,所以有的地区是日出,有的地区是日落,还...
摘要:韩国机房对于日本韩国新加坡等除了中国大陆之外的亚洲地区速度还是可以的。第五韩国首尔机房路由回程测试抽样我们看看国内的三个节点随机的线路回程。 相关商家推荐 Vultr - 拥有17个数据中心 可按小时计费随时删除和开通机器 访问官网 / 优惠活动 / 购买教程 / 基本教程 介绍:Vultr,拥有17个数据中心,可以自定义安装ISO镜像,比如可以安装Windows系统...
阅读 3181·2023-04-25 22:04
阅读 2054·2021-11-22 15:29
阅读 1845·2021-10-11 10:57
阅读 1180·2021-09-24 09:48
阅读 2882·2021-09-23 11:20
阅读 2966·2021-09-09 09:34
阅读 2339·2021-09-02 15:21
阅读 2202·2019-08-30 15:53