您现在的位置是：首页 > 后端

当前栏目

Tesseract .Net SDK C# OCR 2022.1

c#Net SDK OCR Tesseract

2023-09-14 09:13:47 时间

Tesseract .Net SDK C# OCR 库 #将扫描的 PDF 转换为可搜索的文档 #快速准确的基于神经网络的引擎 #纠正低质量扫描 # 120 多种语言 # .Net 2.0+, .Net 5, 标准, 核心

Tesseract OCR - industry-fastest .Net OCR library

4 行代码，仅此而已
var api = OcrApi.Create();
api.Init(Languages.English);
using (var renderer = OcrPdfRenderer.Create("searchable.pdf"))
api.ProcessPages(@"scanned.pdf", renderer);

它只是一个魔术！

得益于简单的 API，您只需几行代码即可将扫描的 PDF 转换为可搜索的文档。

顺便说一句，不仅是PDF。添加到您的应用程序 JPEG、多页 TIFF 或 PNG 转换为可搜索的 PDF 现在只需几分钟，而不是几小时或几天。

120 多种语言的多种图像格式
Tesseract.NET SDK 可准确识别超过 120 种语言的文本，支持多语言文本，并且可以训练使用以前未知的语言。作为标准支持的语言包括英语、法语、意大利语、德语、西班牙语、阿拉伯语、中文、希伯来语、日语、俄语、泰语等。

纠正低质量扫描
例如，去歪斜输入过滤器会自动旋转图像，使其以正确的方式向上和正交。如果页面太倾斜，Tesseract 的线分割质量会显着降低，这会严重影响 OCR 的质量。

Patagames OCR SDK 中内置的用于增强 OCR 性能的输入过滤器包括：二值化、对比度和对比度归一化、去偏斜、增强分辨率、腐蚀和膨胀、膨胀和收缩、反转、删除边框、旋转、ToGray 和白色背景。

为您的 .Net 应用程序配备 OCR 功能的最佳方式
虽然 Tesseract 无疑是迄今为止最好的 OCR 库，但 Tesseract.NET SDK 是为您的应用程序配备文本识别功能的最佳方式之一。

Tesseract.Net SDK 结合易于部署、出色的识别准确性、闪电般快速的 OCR 和多种输出选项（包括 PDF、HOCR、UNLV 和纯文本），提供灵活简单的 API 以及许多高级和低级文本识别程序。

多亏了简单的 API，您可以用几行代码将给定的图像转换为可搜索的文本。如果您需要更详细地了解文本的组成部分，Tesseract.NET SDK API 提供了许多类来检索单个字母、单词、段落甚至字体参数。

您现在可以免费试用 Tesseract.NET SDK，体验 .Net 应用程序有史以来最快、最完美的光学识别。

享受支持 OCR 的 .Net 应用程序的强大开发！

猜你喜欢

的查找探索Linux中数字的检索之路（Linux字符串中数字）
tcptraceroute与traceroute
Python项目48-插播短信接口(使劲撸)
在CI环境中使用MySQL（cimysqlin）
F5和Oracle 组合成强大的数据处理工具（f5 oracle）
C++运算符重载成员函数与友元函数详解
锁Redis实现Java控制过期锁（redisjava过期）
Linux操作系统的多样分支（linux的分支）
运算Linux下的时间加减运算（linuxdate加减）
Oracle探究数据库的真谛（oracle什么是数据库）
macOS安装php-redis扩展的注意事项
一道题让你理解浮点型数据在内存的存储方式
WordPress 文章修订功能介绍和屏蔽
CSS 教程
Oracle 视图 DBA_JAVA_INNERS 官方解释，作用，如何使用详细说明
C++标准模板库函数sort的那些事儿
Linux下的编程语言探究（linux什么编程语言）
Linux基础知识概览：攻克基本技巧（linux基础知识点总结）
卸载redis集群一步一步实现（卸载redis集群）
数据库插入数据之selectintofrom与insertintoselect区别详解

相关主题

C#/.NET堆与栈
C#习题四
C# 结构类型
c#.net基础
C#.NET.JSON库
C#6.0和C#7.0
c# 源生成器

zl程序教程

当前栏目

Tesseract .Net SDK C# OCR 2022.1

相关文章